微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 中国人民大学提出企业智能搜索新方案:让AI助手同时搜本地和网络信息

中国人民大学提出企业智能搜索新方案:让AI助手同时搜本地和网络信息

2025-08-15 08:24
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-08-15 08:24 科技行者

这项由中国人民大学高瓴人工智能学院窦志成教授团队与百川智能科技公司合作完成的研究发表于2025年8月,详细展现了企业级深度搜索的全新解决方案。有兴趣深入了解的读者可以通过论文代码库https://github.com/plageon/HierSearch访问完整论文和相关资料。

当我们在工作中遇到复杂问题时,往往需要同时查阅公司内部的文档资料和互联网上的公开信息。比如一位金融分析师想了解某家公司的投资风险,他既需要查看公司内部的专业数据库,也要搜索网上的新闻报道和市场分析。然而现有的AI搜索助手就像只会在一个图书馆找书的管理员,要么只能翻阅内部资料,要么只会上网搜索,无法同时利用两种信息源来给出全面的答案。

中国人民大学的研究团队发现了这个问题,并提出了一个创新的解决方案。他们开发了一个名为HierSearch的系统,就像组建了一个专业的信息收集团队。这个团队有三个成员:一个专门负责搜索公司内部资料的本地专家,一个擅长网络搜索的网络专家,还有一个负责统筹协调的规划者。当用户提出问题时,规划者会根据问题的性质决定派哪个专家去搜索,或者让两个专家同时行动,最后将所有找到的信息整合起来给出最佳答案。

这种分工合作的方式解决了传统方法的一个关键问题。以前的系统就像让一个人同时掌握所有技能,结果往往是样样会但样样不精。特别是在网络搜索这种相对困难的任务上,系统总是表现不佳,更愿意去搜索那些容易获得结果的本地资料。这就好比一个学生在考试时总是先做简单题,把难题留到最后,结果时间不够难题做得很差。

为了训练这个分层的AI团队,研究人员采用了一种叫做"分层强化学习"的方法。这个过程就像培训一个专业团队:首先单独训练每个专家,让本地搜索专家熟练掌握内部资料的检索技巧,让网络搜索专家练好上网找信息的本领。等两个专家都练得炉火纯青了,再训练规划者学会如何指挥这两个专家,什么时候该派谁上场,如何整合他们找到的信息。这种先分后合的训练方式比一开始就让一个系统学会所有技能要高效得多。

在这个过程中,研究团队还发现了另一个重要问题:专家们找到的信息往往包含很多无关内容,甚至有些错误信息。就像让两个助手去图书馆找资料,他们不仅会带回相关的书籍,还可能带回一堆不相关的材料,甚至是一些过时的错误信息。如果规划者不加筛选就把这些信息全盘接收,最终的答案质量就会大打折扣。

为了解决这个问题,研究人员设计了一个"知识精炼器",就像给团队配了一个专业的信息筛选员。这个筛选员会仔细检查每个专家带回来的信息,首先筛选出那些真正有助于回答问题的关键证据,然后从全局角度再次筛选,确保最终交给规划者的都是最有价值的信息。这个筛选过程分为两个步骤:先看哪些证据直接支持了专家的推理过程,再看哪些证据对最终结论有整体贡献。

整个HierSearch系统的工作流程就像一个高效的咨询团队处理客户问题。当客户提出问题时,项目经理(规划者)首先分析问题的性质,然后决定是派内部资料专家独自处理,还是派网络调研专家单独行动,或者让两个专家同时工作。专家们各自利用自己的工具和资源进行搜索:内部专家会查阅公司的文档库和知识图谱,网络专家则使用搜索引擎和浏览器获取网上信息。当专家们完成搜索后,信息筛选员会对他们的发现进行质量控制,过滤掉无关和错误的信息。最后,项目经理综合所有高质量信息,给出客户满意的答案。

研究团队在六个不同领域的数据集上测试了HierSearch的表现,包括通用领域、金融领域和医学领域。测试结果显示,这个分层系统在所有测试中都显著优于传统方法。更重要的是,HierSearch不仅答案质量更高,搜索效率也更好,避免了传统系统经常出现的无效搜索问题。

特别值得注意的是,研究人员发现分层训练方法比传统的"扁平化"训练方法效果要好得多。在传统方法中,系统需要同时学会使用所有搜索工具,结果往往是学习效率低下,而且总是偏向于使用那些容易出结果的工具。就像让一个人同时学习钢琴、小提琴和吉他,最后可能哪个都学不好。而分层方法让每个专家专精于自己的领域,然后通过规划者来协调,就像让音乐家各自练好自己的乐器,再通过指挥家来协调整个乐团的演奏。

在实际应用效果的分析中,研究团队发现HierSearch在多知识源环境中的搜索成功率和推理成功率都显著高于现有方法。系统能够成功利用本地知识源的优势(专业性强、针对性好)和网络知识源的优势(信息全面、更新及时),在不同类型的问题上都能给出高质量的答案。

从效率角度来看,虽然HierSearch使用了三个智能体的分层架构,但其计算成本并没有显著增加。相比那些需要并行搜索多个知识源的传统方法,HierSearch通过智能的任务分配和信息筛选,实际上减少了不必要的搜索操作,特别是那些成本较高的网络搜索。

这项研究的意义不仅在于技术创新,更在于为企业级AI应用提供了一个实用的解决方案。在现实的企业环境中,员工确实需要同时利用内部知识和外部信息来解决复杂问题。HierSearch为这种需求提供了一个可行的技术路径,让AI助手能够像人类专家团队一样高效协作,为用户提供更全面、更准确的信息支持。

说到底,HierSearch就像是给企业配备了一个永不疲惫的智能研究团队。这个团队不仅能够快速准确地找到所需信息,还能智能地判断什么时候需要查内部资料,什么时候需要搜索网络信息,以及如何将不同来源的信息有效整合。对于那些需要处理大量信息查询的企业来说,这样的系统可以显著提高工作效率,减少人工搜索的时间成本,同时保证信息的准确性和全面性。这项技术的成熟和推广,可能会改变我们在工作中获取和使用信息的方式,让每个人都能享受到专业研究团队的服务。

Q&A

Q1:HierSearch系统是怎么工作的?它和普通搜索有什么不同?

A:HierSearch就像一个三人专业团队,包括本地搜索专家、网络搜索专家和统筹规划者。当用户提问时,规划者会根据问题性质决定派哪个专家搜索,或让两个专家同时行动。系统还配备信息筛选员过滤无关和错误信息。这种分工协作方式比传统的单一搜索工具更全面准确。

Q2:分层强化学习训练方法比传统方法好在哪里?

A:分层训练就像先让每个音乐家练好自己的乐器,再让指挥家学会协调整个乐团,比让一个人同时学所有乐器效果好得多。研究发现传统方法容易偏向简单任务,在网络搜索等困难任务上表现不佳,而分层方法让每个专家都能精通自己的领域,整体效果显著提升。

Q3:这个系统适合什么样的企业使用?效果怎么样?

A:HierSearch特别适合需要同时利用内部资料和外部信息的企业,如金融、医疗、咨询等行业。测试显示系统在六个不同领域数据集上都显著优于现有方法,不仅答案质量更高,搜索效率也更好,能有效减少无效搜索,降低人工成本。

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-