微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

李彦宏预言语音图像等非文字搜索未来五年超50%

百度世界李彦宏

李彦宏预言语音图像等非文字搜索未来五年超50%

作者：CNET科技资讯网

2014-09-03 15:20

分享至：

移动互联网已经成为互联网行业兵家竞争最激烈的领域之一，各路企业纷纷以用户需求为导向进行发展布局。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2014-09-03 15:20 • CNET科技资讯网

移动互联网已经成为互联网行业兵家竞争最激烈的领域之一，各路企业纷纷以用户需求为导向进行发展布局。

9月3日，2014年百度世界大会上，百度董事长兼CEO李彦宏与业界分享了一个关于用户行为变化的重要洞察：未来五年用户的移动需求会发生质的变化，通过语音、图像等非文字形式表达的用户需求将超过50%。

李彦宏指出，移动用户正在逐渐脱离传统键盘输入习惯，相比较键盘这样需要经过长久学习才能掌握的工具，通过语音、图像等方式表达搜索请求，是最自然的，本能的表达需求方式。它所带来用户行为的转变，也注定会成为移动互联网最重要入口。

发展心理学的研究表明，人类所获取的70%的外部信息来自视觉，因此人类跟周边世界中人和物的沟通以及交互，极其依赖于图像；而从婴幼儿牙牙学语开始，通过语言沟通实现需求表达即成为人类的本能。因此，在李彦宏看来，移动互联网正不断推动语音、图像等需求表达，这样的用户行为变化也说明未来的科技将更加回归自然、贴近人性。

当前移动网络基础能力的增强使网速大幅提高，为用户使用语音提供了良好的环境；智能设备的推陈出新，也为语音提供了高质量的输入条件。而全民低成本造图，日均数亿量级的社会化图片分享也为移动互联网提供了大量图片数据。这一趋势，在移动互联网技术依托下，让图像识别、语义理解和人机对话连在一起，帮助用户完成任务。当用户需求随着技术自由实现急剧增长，未来将足够引起一个划时代的变革。
“我们正在积极的努力，在技术上进行研发，不断提升我们的语音识别和图像识别能力，更好地满足用户的需求”，李彦宏说。

试想一下，当你在街上看到一个商标，用摄像头对其进行拍照，后台可以先进行提取，再进行模板匹配的方法进行图像结算——与其特征进行匹配，给出用户最想要的结果——包括价格、购买信息甚至一键下单；对手机说“中午我想吃汉堡”，12点准时外卖在敲门，这样的行为真正地回归了自然的方式，更方便、更人性地传递着互联网技术改变人们生活的重大意义。而这些想象，以李彦宏的趋势洞察来审视，相信会在不远的将来即将实现。

不仅如此，李彦宏在百度世界上还宣布“百度筷搜”1.0版本问世，对于这样一款仅凭概念就火爆业界的产品，“百度筷搜”已经能够实现检测油质优劣、水质酸碱度等交互功能，无疑正在向成为“非文字需求”的更多典型应用场景而努力。

尼葛洛·庞帝早在《数字化生存》中提到，信息完全取决于我们眼中所见的品质。经过近年的技术研究与布局，百度的语音、图像技术现在已经到了破茧而出的关键时刻，而李彦宏和他掌舵的百度，正依靠技术积累和创新，在把握未来用户移动需求之路上得以先行，并催生移动互联网变革的春天

百度世界李彦宏

分享至

0赞

好文章，需要你的鼓励

推荐文章

华为
数据库
开源

2025-12-31 10:23

openGauss熊伟：oGRAC+超节点，AI数据库的下一个五年

openGauss的目标是探索oGRAC和超节点深度融合的可能，打造超节点原生数据库。
人工智能
深度学习
机器视觉

2025-12-31 10:12

清华团队让机器学会"透视眼"：用视频AI破解透明物体深度估计难题

清华团队开发DKT模型，利用视频扩散AI技术成功解决透明物体深度估计难题。该研究创建了首个透明物体视频数据集TransPhy3D，通过改造预训练视频生成模型，实现了准确的透明物体深度和法向量估计。在机器人抓取实验中，DKT将成功率提升至73%，为智能系统处理复杂视觉场景开辟新路径。
人工智能
混合专家模型
模型优化

2025-12-31 10:11

ByteDance推出全新混合专家模型训练法：让AI专家团队各司其职，大幅提升大语言模型性能

字节跳动研究团队提出了专家-路由器耦合损失方法，解决混合专家模型中路由器无法准确理解专家能力的问题。该方法通过让每个专家对其代表性任务产生最强响应，同时确保代表性任务在对应专家处获得最佳处理，建立了专家与路由器的紧密联系。实验表明该方法显著提升了从30亿到150亿参数模型的性能，训练开销仅增加0.2%-0.8%，为混合专家模型优化提供了高效实用的解决方案。
人工智能
视频生成
交互控制

2025-12-31 10:10

上海AI实验室创造"无限视频世界"，用键盘就能探索！

上海AI实验室团队开发的Yume1.5是一个革命性的AI视频生成系统，能够从单张图片或文字描述创造无限可探索的虚拟世界。用户可通过键盘控制实时探索，系统8秒内完成生成，响应精度达0.836，远超现有技术。该系统采用创新的时空通道建模和自强制蒸馏技术，支持文本控制的事件生成，为虚拟现实和内容创作领域开辟了新的可能性。