1月5日千问APP语音功能全面焕新,上线10款全新AI音色,覆盖不同年龄层与性格特征。同时,用户克隆的专属音色也同步升级,实现更丰富、更拟人化的语音交互体验。

据悉,新音色通过研发架构创新和大规模多说话人语音数据训练,在保持高清晰度的同时,显著提升语音互动的拟人感,具备更加精准的语气、语调、停顿和情感等。支持中英混合发音、多语种无缝切换,适用于剧本演绎、多人对话等创意场景。
产品负责人介绍,这些音色经过由语言学家、音频工程师及用户体验专家组成的专业评审团多轮盲测评估,在自然度、语速控制、情感表现力、声音复刻还原度、多语言适配能力及系统稳定性六个维度上表现均衡。
未来,千问APP还将持续优化AI语音,拓展在日常生活、有声内容创作、无障碍服务等多场景的应用。
好文章,需要你的鼓励
AWS AI Labs研究团队发布EvalAgent,这是一套通过"评估技能"自动生成AI智能体评测方案的系统,将首次运行成功率从17.5%提升至65%,并在人类专家评测中获得79.5%的偏好选择。
亚历山大大学提出M2Retinexformer,通过融合深度、亮度和语义三种辅助模态,让AI在增强暗光图像时兼顾几何结构与视觉自然度。
浙大、西湖大学等联合提出FAAST,无需反向传播,一次正向扫描将训练样本压缩为快速权重矩阵,推理时间和内存占用分别节省90%和95%以上。
慕尼黑工业大学发布RealICU基准,用专家后见之明评测大语言模型在ICU实时决策中的真实能力,发现现有顶级AI存在有害推荐率过高和锚定偏差两大安全隐患。