
CNET科技资讯网 9月1日 北京消息: 9月1日,2016年百度世界在北京中国大饭店举行。百度创始人、董事长兼CEO李彦宏向外界第一次揭开了百度大脑的神秘面纱。集“语音、图像、自然语言处理和用户画像”四大核心能力于一体的百度大脑,经过多年的技术积累,也让打磨了一年的进化版“度秘”,可以媲美真人的体育赛事解说、多语言翻译等能力,更让人们看到了“百度大脑”下自然语言处理技术的日新月异。
在李彦宏看来,人工智能发展到今天,语音的能力已经非常强大,并进入到了较为成熟的实用阶段;图像的能力也有了长足的进展,越来越多地被人们认可和使用;而同样作为“百度大脑”四大核心功能之一的自然语言处理技术,难度系数却更高。 “语音和图像技术更多处在认知的阶段,而自然语言理解除了要有认知能力之外,还需要逻辑推理能力、规划能力等等,目前还处在更早期的发展阶段中”,李彦宏说。今天的度秘可能在某些条件下依然听不懂人类的语言和需求,但这也意味着,自然语言的理解和处理能力还有很大的发展空间。随着自然语言处理技术的发展,度秘得以展现出更为智能的表达、也为人们拓展出更为多元的服务。
演讲的中间,李彦宏现场展示了度秘新获得的一个能力:解说篮球。著名篮球评论员杨毅也来到现场,当面向李彦宏夸赞了曾与他一起解说比赛的度秘。今年奥运会期间,度秘团队“约战”杨毅,共同解说了一场男子篮球赛。解说当天,原本看似极具挑战意味的“人机大战”,最终却变成了一次“友谊合作”——基于计算机海量存储和高效计算能力、特别是自然语言处理技术的度秘,在学习了几百场比赛之后,不仅很好地帮助杨毅分析了各种赛况,也用其截然不同的语言风格,为杨毅一贯的专业版解说增添了不少趣味性,“机智”的度秘让杨毅感到“出乎意料”,并表示,“度秘对比赛基本知识的储备可能比我还强,男篮决赛时语速的加快也更符合体育竞技的标准。可以想象,如果成为这项产品逐渐成熟,未来就可以为球迷在看比赛时解答更多问题,成为球迷的好朋友。”
对于度秘整体技术能力的进阶,李彦宏谈到,和传统的文字搜索方式相比,度秘与用户间的沟通方式已经非常不一样了。 “现在人们与度秘的交互,超过一半都是通过语音或者图像来完成的”,李彦宏指出,语音和图像的交互占比已达到56%,正逐步超越传统文字的使用频次,成为人们表达需求的主流方式。
除了度秘在自然语言处理能力上的应用,李彦宏提到,机器翻译领域对自然语言理解的技术同样相当依赖。他介绍,如今的百度翻译已经能够支持27种语言之间的互译,随着技术的不断成熟,不同语言互译衍生的几百个翻译方向能力也将逐渐纯熟,而这样的翻译也定将给人们带来不可估量的便利和价值。
好文章,需要你的鼓励
这项由Snowflake AI Research发表的研究挑战了传统语言学对大型语言模型的批评,通过引入波兰语言学家Mańczak的理论框架,论证了LLM的成功实际上验证了"频率驱动语言"的观点。研究认为语言本质上是文本总和而非抽象系统,频率是其核心驱动力,为重新理解AI语言能力提供了新视角。
freephdlabor是耶鲁大学团队开发的开源多智能体科研自动化框架,通过创建专业化AI研究团队替代传统单一AI助手的固化工作模式。该框架实现了动态工作流程调整、无损信息传递的工作空间机制,以及人机协作的质量控制系统,能够自主完成从研究构思到论文发表的全流程科研工作,为科研民主化和效率提升提供了革命性解决方案。
德国马普智能系统研究所团队开发出专家混合模型的"即时重新布线"技术,让AI能在使用过程中动态调整专家选择策略。这种方法无需外部数据,仅通过自我分析就能优化性能,在代码生成等任务上提升显著。该技术具有即插即用特性,计算效率高,适应性强,为AI的自我进化能力提供了新思路。
Algoverse AI研究团队提出ERGO系统,通过监测AI对话时的熵值变化来检测模型困惑程度,当不确定性突然升高时自动重置对话内容。该方法在五种主流AI模型的测试中平均性能提升56.6%,显著改善了多轮对话中AI容易"迷路"的问题,为构建更可靠的AI助手提供了新思路。