1月30日消息,千问C端应用团队的四篇人工智能领域研究论文入选2026国际学习表征会议(ICLR 2026),论文聚焦扩散模型训练、多轮对话决策、信息验证及模型价值观对齐等关键问题,部分成果已有实际应用,推动AI助手在复杂场景下更加聪明、可靠、实用。
ICLR与NeurIPS、ICML并称为机器学习和人工智能领域三大顶级国际会议。本届会议投稿量接近19000篇,接收率创下近年来新低。
本次四篇论文在多个前沿领域取得创新突破。在扩散语言模型(Diffusion Models)研究方面,千问C端应用团队针对dLLM独特的掩码训练不稳定性,将其系统分解为了三种不同的噪声来源,并相应提出帕累托最优的无偏训练算法。该算法显著降低了dLLM的训练波动、进而提升其图文生成质量。这意味着在内容生成、创作辅助等应用中,AI输出将更加稳定。
围绕医疗多轮对话中的复杂推理任务,团队提出了自适应树策略优化(ATPO)方法,使AI能够根据对话中的不确定性动态调整决策路径。当信息不足时,AI会主动追问关键问题;当线索清晰时,则快速给出判断。这一能力可帮助AI助手在医疗咨询等专业场景学会“主动问诊”,让AI像经验丰富的医生一样,只问最关键的问题,避免无用的来回对话。
在信息检索与验证方面,研究团队构建了“提问—解答—验证”的自博弈强化学习框架,使AI在无需人工标注的情况下不断自我验证与进化。这一机制有助于提升AI在复杂问题下的检索与核验能力,在学习辅助、研究支持等知识密集型场景中表现更为可靠。
此外,在模型价值观对齐研究中,团队引入信息论偏见消除方法,引导奖励模型关注真正与人类偏好相关的信号,减少冗长、格式化但信息密度不高的输出。这使得AI在训练过程中真正关注能够帮助到用户的核心要点,降低模型输出中出现“表面迎合但缺乏实质内容价值”的情况。
业内专家指出,当前大模型竞争正从“参数规模”转向“算法深度与工程实效”。千问C端应用团队在生成稳定性、多轮对话决策和模型对齐等方向上的系统性探索,体现了其在基础算法与应用导向研究上的持续投入。
值得一提的是,此次千问C端应用团队入选 ICLR 2026 的四篇论文相关代码均已开源。通过开放核心实现细节,将为行业在提升AI可用性、可靠性方面提供有益参考。
好文章,需要你的鼓励
加州大学洛杉矶分校等机构联合推出的Unify-Agent突破了传统AI图像生成的知识局限,通过整合"思考-搜索-整理-绘制"四步工作流程,让AI画师具备主动查找资料的能力。该系统在FactIP基准测试中相关性指标提升61%,特别擅长处理需要准确世界知识的长尾内容和文化特色图像生成任务。
中科院团队开发的FlowPIE系统首次将动态文献探索与创意进化相结合,突破传统AI科学创意生成的同质化局限。该系统通过流引导蒙特卡洛树搜索实现文献检索与创意生成的紧密耦合,并采用类生物进化机制持续优化创意质量。实验显示,FlowPIE在新颖性、可行性等维度显著超越现有方法,展现出强大的跨领域泛化能力,为AI辅助科研开辟了新路径。
阿里巴巴DAMO研究院推出Lingshu-Cell虚拟细胞建模系统,采用掩码离散扩散模型技术,能够精确模拟和预测细胞在基因编辑、药物刺激等干预下的反应。该系统在国际虚拟细胞挑战赛中表现出色,为个性化医疗和药物开发开辟了全新路径,标志着数字生物学时代的到来。
上海AI实验室联合多所高校发布GEMS技术,通过智能团队协作机制让60亿参数的小模型在图像生成上超越顶级商业模型。该系统包含循环优化、记忆管理和技能库三大核心,采用多轮迭代和专业技能匹配,在主流测试中提升14分以上,为资源受限环境下的高质量AI应用提供新方案。