
在联想Tech World 科技创新大会上,李彦宏作为压轴嘉宾出场,他一出场便邀请杨元庆去吃韩国菜,面对讲韩语的服务员和写满了韩语的菜单,李彦宏的解决办法是运用百度的人工智能,将韩文菜单进行语音翻译。
联想TechWorld科技创新大会现场
早在今年两会期间,李彦宏提出了中国大脑提议,今天他对外展示了百度在这方面的研发进展,他说:“事实上百度在过去几年想做的一个项目是百度大脑,这相当于中国大脑的迷你版本。迷你版的智能水平达到了三四岁孩子的智力。”
百度公司创始人、董事长兼首席执行官李彦宏
计算机的人工智能不仅可以让你听得懂,也可以让你看得明白。李彦宏开场演示的百度语音翻译就是百度人工智能的一个体现。
李彦宏在现场进行演讲
根据李彦宏介绍:百度翻译APP目前可支持包括希腊语、葡萄牙语在内的18种语言。而百度翻译的运行原理就是通过大数据、人工智能以及机器的学习来实现。语音识别通过语音翻译,来领会到不同语种间的每句话的意思。当然他建议"计算机的人工智能不仅要让人听得懂,并且还要看得明白。怎样使得机器看得懂信息,是百度在人工智能方面当前需要努力解决的重要问题。"
此外百度人工智能还可以通过2D照片还原出3D场景。比如在尼泊尔地震中,很多加德满都的文化遗产都被毁了,很多用户将自己拍摄的古建筑图片传到网络上,如果是传统意义上,我们看图片都是静态孤立的一张张图,并且由于每个人拍照角度不同,就会形成无数人围绕很多古建筑拍摄了多张照片的错觉。那百度要做什么?李彦宏说“百度可以根据一张照片来判断这个人拍摄的角度是什么角度,是站在地上的什么位置去拍了古建筑。单单靠一个照片我们判断不出来角度,判断不出来时间。但是当无数个照片都串在一起的时候,我们用人工智能的技术就可以搞清楚在哪个角度是哪个时间拍的,合成起来就成为了还原的古建筑的形象。”
李彦宏还现场演示了看图说话,“它的原理是通过百度大脑智能读取信息内容,从而理解人在问什么问题。”从演示中我们可以看到看图说话能辨识人打网球、用网球拍照、辨识道路禁止停车红色标志等。
李彦宏现场演示看图说话
从历史的角度看,人工智能已经有50-60年历史,但基本上都不实用,因为头50年基本上都是学术性的探讨。不过李彦宏对人工智能的未来表示乐观。他说"最近几年随着计算能力的增加、计算成本的降低,原来我们不敢想、不能做的事情现在能想了、能做了。"而随着联想、微软、英特尔包括百度等众多公司间的不断竞争与促进,人才的激发与创造,从而可以让技术真正改变普通人的生活,从而改变整个世界。
所以,他认为:"现在只是刚刚开始,其实其实人工智能还可以做很多的东西。未来随着我们创新的继续,随着大数据积累越来越多,随着人工智能技术不断推进,百度大脑会越来越接近一个普通人或成年人的智力水平。"
好文章,需要你的鼓励
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。
MemoBench是哈佛大学等机构联合推出的视频生成评测基准,专测AI在物体消失再重现场景下的记忆能力,揭示了当前所有主流模型的核心盲区。
研究发现AI代码修复工具默认的"写代码→跑测试→再改"流程中,禁止运行测试几乎不影响修复成功率,却能节省超过一半的时间和费用。