微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 AI助理的"分工协作"时代:人大团队用层级推理破解深度搜索难题

AI助理的"分工协作"时代:人大团队用层级推理破解深度搜索难题

2025-07-04 17:21
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-07-04 17:21 科技行者

这项由人大高瓴人工智能学院的金嘉杰、李小汐、董冠廷等研究团队完成的创新研究发表于2025年7月,论文题为《Decoupled Planning and Execution: A Hierarchical Reasoning Framework for Deep Search》。有兴趣深入了解的读者可以通过GitHub代码库https://github.com/ignorejjj/HiRA访问相关资源。

当我们在网上搜索复杂问题时,往往需要查阅多个网页、对比不同信息、甚至进行计算验证,这个过程需要大量的思考和决策。现在的AI助理虽然聪明,但面对这类复杂任务时就像一个全能选手试图同时处理太多事情,结果往往顾此失彼。人大团队的这项研究提出了一个全新的解决方案:让AI像现实中的工作团队一样分工合作,有人负责制定总体计划,有人负责具体执行,各司其职却又协调配合。

传统的AI搜索就像一个人既要当导演又要当演员,还要兼任摄影师和剪辑师。这种"一人身兼数职"的模式虽然看似高效,但实际上会因为任务过多而导致思路混乱,最终影响工作质量。研究团队发现,当AI系统试图在推理过程中直接调用搜索工具、处理图片或执行代码时,这些具体操作的细节会干扰其高层次的逻辑思考,就像一个指挥家在指挥交响乐时突然被要求去调试音响设备一样。

为了解决这个问题,研究团队开发了名为HiRA(Hierarchical ReAsoning)的框架,这个系统就像一个高效的企业组织架构。在这个"企业"中,有一个负责战略规划的"总经理"(元推理规划器),一个负责任务分配和协调的"项目经理"(自适应推理协调器),还有多个各有专长的"部门主管"(领域专门执行器)。每个角色都专注于自己最擅长的工作,通过有序的沟通和协作来完成复杂任务。

这种分工协作的理念源于一个简单却深刻的观察:在现实生活中,最优秀的团队往往不是由全能型人才组成的,而是由专业分工明确、协作高效的专家团队构成的。一家成功的餐厅不会让主厨同时兼任服务员和收银员,同样,AI系统也不应该让同一个模型既做抽象规划又处理具体执行细节。

HiRA系统的核心创新在于建立了三层清晰的分工体系。最上层是元推理规划器,它就像一个经验丰富的项目经理,负责理解用户的复杂需求,将其分解为一系列具体可执行的子任务。这个规划器不需要关心具体如何搜索网页或处理图片,它只需要用自然语言描述"需要搜索ASEAN国家列表"或"需要计算两个城市之间的距离"这样的子任务。

中间层是自适应推理协调器,扮演着"项目经理"的角色。它接收来自上层的子任务描述,分析每个任务的特点和难度,然后决定派遣哪个专门团队来处理。如果任务需要深度网络搜索,它会选择搜索专家;如果需要处理图片或视频,它会指派多模态专家;如果需要编程计算,它会安排代码专家。更重要的是,这个协调器还负责将专家的工作成果转化为易懂的形式,反馈给上层规划器。

最底层是各个领域的专门执行器,它们就像不同部门的技术专家。搜索专家擅长在网络上查找信息,既能进行快速的事实查询,也能进行深度的多轮探索;多模态专家能够理解和分析图片、视频、音频等不同类型的媒体内容;计算推理专家则能够编写和执行代码,处理需要精确计算的任务。每个专家都专注于自己的专长领域,通过多轮思考和工具调用来完成分配的任务。

为了确保这个"团队"能够高效协作,研究团队还设计了一套双通道记忆机制,就像公司的知识管理系统。这套系统包含两种类型的记忆:事实记忆和资源记忆。事实记忆存储各个专家在工作过程中发现的重要信息和结论,并记录这些信息的来源,确保可追溯性。资源记忆则保存有用的信息资源路径,如网页链接、文件位置等,为后续任务提供参考。这样,当处理相关任务时,新的专家可以利用之前的发现,避免重复劳动。

这种分工协作的设计带来了显著的优势。首先是思路更加清晰,上层规划器不再被具体操作的细节所干扰,能够专注于逻辑推理和策略制定。其次是执行更加高效,每个专家都能在自己擅长的领域发挥最大效能。再次是扩展性更强,当需要增加新的能力时,只需要添加相应的专家模块,而不需要重新训练整个系统。

为了验证这套系统的效果,研究团队在四个具有挑战性的深度搜索任务上进行了全面测试。这些任务涵盖了不同的难度等级和应用场景,包括需要多步推理的通用AI助理任务、需要网页导航的信息检索任务、需要事实核查的简单问答,以及需要复杂推理的学术问题。

在通用AI助理测试中,HiRA系统的表现最为出色。这类任务通常需要综合运用多种能力,比如搜索信息、处理文件、进行计算等。传统的单一模型方法在这种复杂任务上往往力不从心,而HiRA系统通过合理的任务分解和专家协作,能够系统性地处理各个环节。实验结果显示,HiRA在最困难的任务级别上达到了15.8%的准确率,而传统方法只有0-5.2%的表现。

网页导航任务的测试结果同样令人鼓舞。这类任务要求AI系统能够在多个网页之间跳转,提取和整合信息。HiRA系统在不同难度级别上都表现出了稳定的优势,特别是在需要深度探索的困难任务上,其54.2%的准确率明显超过了其他方法的31.3-53.0%。

在事实核查任务上,HiRA系统展现了其在处理大量信息时的优势。虽然这类任务相对简单,但需要快速准确地从海量信息中提取相关事实。HiRA的81.5%准确率证明了其在信息检索和验证方面的可靠性。

最有挑战性的学术问题测试进一步证实了分工协作的价值。这些问题通常涉及数学、物理、计算机科学等多个领域,需要深度的推理和计算。虽然所有系统在这类任务上的整体表现都不算很高,但HiRA的14.2%准确率仍然显示出其在处理复杂推理任务时的潜力。

为了更深入地理解系统各个组件的作用,研究团队还进行了详细的消融实验。这些实验就像拆解一台精密机器,逐个移除不同部件来观察性能变化。结果发现,协调器的推理转移机制最为关键,当移除这个功能时,系统性能出现了显著下降。这说明合理的任务分配和专家选择对整体效果至关重要。

记忆机制的重要性也得到了验证,特别是在涉及文件处理的任务中。当移除记忆功能时,系统需要重复获取已经处理过的信息,导致效率降低。这就像团队成员没有共享的工作记录,总是在重复别人已经做过的工作。

在执行层面,不同类型专家的贡献各有不同。搜索专家的作用最为明显,移除后系统在所有任务上都出现大幅性能下降,这不难理解,因为深度搜索任务本质上都需要从网络获取信息。代码专家的重要性在多功能任务中表现突出,而多模态专家虽然影响相对较小,但在涉及图片、视频处理的特定任务中仍然不可或缺。

效率分析结果也很有启发性。相比于直接将所有工具集成到单一模型中的方法,HiRA系统实际上使用了更少的推理步骤和环境交互次数。这看似矛盾的结果实际上反映了分工协作的效率优势:每个专家在自己的领域内能够更快地找到解决方案,避免了单一模型在多个工具之间反复尝试的低效模式。

研究团队通过一个具体案例生动地展示了HiRA系统的工作流程。这个案例要求找出ASEAN国家中首都地理距离最远的两个国家。系统首先通过元推理规划器分析任务,认识到需要先获取ASEAN国家列表,然后计算各首都之间的距离。随后,协调器将信息搜索任务分配给搜索专家,将距离计算任务分配给代码专家。

在执行过程中,系统还展现了自我纠错的能力。当代码专家在处理缅甸首都名称时遇到拼写问题导致搜索失败,协调器能够识别这个问题,重新分配任务确认正确的拼写,然后让代码专家用正确信息重新计算。这种自适应调整能力是传统单一模型方法难以实现的。

这项研究的意义远超出了技术本身的创新。它为AI系统的设计提供了一个新的思路:不是追求单一模型的全能性,而是通过合理的分工协作来实现复杂任务的高效处理。这种理念在其他AI应用领域也有广阔的应用前景,比如自动化软件开发、科学研究辅助、教育个性化等场景。

从实用角度来看,HiRA系统的模块化设计使其具有很强的扩展性和适应性。当需要处理新类型的任务时,只需要开发相应的专家模块并接入协调框架,而不需要重新设计整个系统。这种设计理念对于实际部署具有重要价值,特别是在需要快速适应新需求的商业环境中。

当然,这项研究也面临一些挑战和限制。多模型协作必然带来额外的计算开销和复杂性,如何在性能提升和资源消耗之间找到平衡点是一个需要持续优化的问题。此外,不同专家之间的协调机制还有进一步完善的空间,特别是在处理更加复杂和开放性的任务时。

展望未来,这种分工协作的AI系统设计理念可能会催生更多创新应用。我们可能会看到专门处理不同学科问题的AI专家团队,或者能够模拟不同角色视角的创意工作助手。更进一步,这种理念甚至可能影响整个AI行业的发展方向,从追求通用人工智能的单一模型转向构建高效协作的AI生态系统。

说到底,HiRA系统的核心价值在于证明了一个简单而深刻的道理:有时候,最好的解决方案不是让一个人做所有事情,而是让合适的人做合适的事情。在AI快速发展的今天,这种"术业有专攻"的设计理念可能为我们开启了一扇通往更智能、更高效AI系统的大门。对于普通用户而言,这意味着未来的AI助理将能够更好地理解和处理复杂需求,提供更准确、更有用的帮助。

Q&A

Q1:HiRA系统和传统AI搜索有什么区别? A:传统AI搜索像一个人既当导演又当演员,容易顾此失彼。HiRA系统则像一个专业团队,有负责规划的"总经理"、负责协调的"项目经理"和各有专长的"部门专家",通过分工协作来处理复杂任务,效率更高、结果更准确。

Q2:这种分工协作的方式会不会让AI变得更复杂难用? A:恰恰相反,对用户来说使用会更简单。用户只需要向系统提出问题,系统内部会自动进行任务分解和专家协调,用户不需要了解具体的执行过程。就像去餐厅吃饭,你只需要点菜,不需要管厨房里是怎么分工的。

Q3:HiRA系统能处理哪些类型的任务? A:HiRA系统特别擅长需要综合多种能力的复杂搜索任务,比如需要搜索网页、处理图片视频、进行计算验证的问题。实验显示它在通用AI助理任务、网页导航、事实核查和学术问题等方面都有显著提升,准确率比传统方法高出很多。

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-