
CNET科技资讯网 1月8日 北京消息: 1月6日晚,江苏卫视播出的第四季《最强大脑》节目中迎来一位特殊选手,百度派出搭载百度大脑的人工智能机器人“小度”,挑战最强大脑的名人堂选手。
本场比赛经过两小时的鏖战,“小度”,凭借在人工智能和人脸识别领域的深厚积累,以3:2险胜人类最强大脑的代表王峰。
代表着目前代表中国人工智能最高水平——百度大脑的“小度”,背后是万亿级的参数、千亿样本和千亿特征训练,能模拟人脑的工作机制,学习训练极其复杂的模型。有着世界记忆大师美誉的名人堂代表王峰,曾率领中国代表队4:0完胜德国队,打破快速记忆扑克牌世界纪录。
小度与王峰进行了对人脸识别能力的两轮比拼,非常紧张激烈,最难的是用于比对的真人及其照片,年龄跨度居然有二十年之多。以至于章子怡现场高呼:这可比电影好看多了。
在第一轮比赛中,小度和人类选手需要通过分析照片中出现的幼年人脸,来识别出现场20年后的成年人,面对双胞胎识别这一难题,小度精准识别,以72.99%—高于第二张0.01%的识别率成功锁定目标,而名人堂王峰则1:0落败。
在第二轮比赛中,小度和王峰面对照片中出现的人数众多、现场实时照片传输、现场摄像机捕捉晃动、灯光干扰、化妆、微整形等影响,顶住压力,表现同样优秀,在30张共近千人脸的小学毕业照中成功选出了主人公。最终小度机器人以3:2击败名人堂选手王峰。
对于小度机器人赢得胜利,现场嘉宾、北京大学心理学系教授魏坤琳认为,人的面貌在成长过程中受很多因素的影响,儿童时期的面部特征随时间而改变,甚至有些特征会消失。从机器和人类对图像感知来看,机器似乎更不占优势。的确,人类经过几百万年的进化,能够在听觉、视觉上做的很好。而人工智能诞生才60年,相对而言,语音识别、图像识别对机器来说更难。
百度首席科学家吴恩达则表示,这次人机大战,是顶级的人脸识别选手和擅长棋类游戏的人工智能比拼。人脸识别技术不同于一般的图像识别,人脸本身太相似,不易区分;其次表情、光照条件、整容等外因会增加识别难度。而赛场上意外出现了双胞胎,无疑更增加了辨认难度,因为双胞胎骨骼太相似,导致差别特别细微,所以取的面部骨骼点不够多的话是识别不出来。
百度深度学习实验室主任林元庆指出,百度这几年在人工智能上投入了相当的力量。这次人机大战是以实战的方式来,来检验百度人工智能和人类差距。但是,打败人类并不是参赛的目的,而是希望在此过程中不断进步,演化出很好的技术来服务人类。
此前,百度董事长兼CEO李彦宏也在《最强大脑》第四季预告片中表示,如果最强大脑代表人类脑力的极限,那么百度大脑代表人工智能的最高水平。无论输赢,都会对人工智能的技术发展做出突破性的贡献。
1月6日当天,百度大脑还同步宣布了多项技术开放的决定。百度大脑将全新开放十二项场景化技术服务,将基于图像、语音、自然语言、用户画像、机器学习、AR增强现实等领域的能力,面向不同行业定制的四大解决方案,全部对外共享。开发者只要访问百度大脑官网(ai.baidu.com),即可通过开放接口进行接入。
据了解,小度在即将举行的《最强大脑》第四季第二场比赛中将和名人堂选手在声音识别领域进行较量。和图像识别类似,机器识别声音的难度大于人类。人类能否扳回一局,让我们拭目以待。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。