
CNET科技资讯网 9月1日 北京消息: 9月1日,2016年百度世界大会在北京中国大饭店盛大举行。会上,百度首次向外界全面展示百度人工智能成果——“百度大脑”,并宣布对广大开发者、创业者及传统企业开放其核心能力和底层技术。开放的百度大脑,将引领整个互联网行业进入下一幕。
百度创始人、董事长兼首席执行官李彦宏在会上表示,移动互联网利用人口红利带来的增长已经逐渐见顶,互联网正在进下一幕人工智能时代,人工智能将使全社会迎来变革性的发展。
作为最早布局人工智能的技术公司之一,百度大脑已建成超大规模的神经网络,拥有万亿级的参数、千亿样本、千亿特征训练,能模拟人脑的工作机制。相比三年前2-3岁孩子的智力水平,百度大脑如今智商已经有了超前的发展,在一些能力上甚至超越了人类。
百度大脑之所以拥有如此强大的“智商”,得益于百度大脑背后强大的硬件和软件支撑。数十万台服务器构成了百度大脑的实体,几年前百度便开始自建中国最大的GPU集群,保证了百度大脑超强的计算能力。而在软件方面,搜索起家的百度具备了得天独厚的优势:全网的网页数据、十多年来累积的搜索数据,以及百亿级的图像、视频、定位数据成为了百度大脑不断学习、快速成长的养料。
会上,李彦宏详细阐释了百度大脑在语音、图像、自然语言处理和用户画像领域的前沿进展。目前,百度大脑语音合成日请求量2.5亿,语音识别率达97%。强大的语音能力,不仅可以帮助一位年轻的销售员快速成为熟练、干练的金牌销售,也可以合成一代巨星张国荣的声音,实现与粉丝13年后的”隔空对话”。
在图像能力方面,百度大脑人脸识别准确率达到99.7%;百度无人车刷新了KITTI测试的多个世界记录——在KITTI竞争最激烈的车辆检测评比中排名第一。而在最难的自然语言处理方面,度秘与知名体育评论员杨毅同台解说。用户画像领域,百度大脑拥有千万级别的用户标签体系,实现“通用与垂直领域”相结合。
语音、图像、自然语言处理和用户画像是当下人工智能领域最强大、最核心的能力。百度在这四大领域的应用,已经深入到了日常生活当中。
在时代变革大幕开启之际,为了助力广大合作伙伴全面共享AI时代,完成下一幕的转型升级,百度大脑将全面开放未来,百度大脑将与各行各业结合,衍生出不同领域的行业大脑,比如医疗大脑、交通大脑、金融大脑等等。
目前,百度大脑已经与不同领域发生了碰撞。例如,欧莱雅基于百度AR技术,在品牌营销领域做创新,实现销售突破;《魔兽》出品方传奇影业利用百度的用户画像能力,实现精准推荐,提升票房。值得一提的是,英伟达公司联合创始人兼首席执行官黄仁勋在大会现场发表了主题演讲,并携手百度联合宣布继续在无人驾驶汽车领域深化合作,双方将汇聚百度云平台、地图技术和NVIDIA汽车人工智能计算平台,创建从云服务到汽车自动驾驶的平台。
最后,百度首席科学家吴恩达公布了百度人工智能的两大开放平台:百度深度学习平台与百度大脑开放平台。与其他第三方平台相比,百度深度学习平台以更少的数据准备及训练配置,实现易学易用、性能高效;而百度大脑开放平台则向合作伙伴开放技术与培训资料,实现因智而能,促进行业发展。
百度作为最早布局人工智能领域的公司,在互联网下一幕开启之际全面开放助力传统企业和开发者升级,也是在经济新常态下促进整个社会经济发展的体现。
好文章,需要你的鼓励
谷歌DeepMind等顶级机构联合研究揭示,当前12种主流AI安全防护系统在面对专业自适应攻击时几乎全部失效,成功率超过90%。研究团队通过强化学习、搜索算法和人类红队攻击等多种方法,系统性地突破了包括提示工程、对抗训练、输入过滤和秘密检测在内的各类防护技术,暴露了AI安全评估的根本缺陷。
西蒙弗雷泽大学和Adobe研究院联合开发的MultiCOIN技术,能够将两张静态图片转换为高质量的过渡视频。该技术支持轨迹、深度、文本和区域四种控制方式,可单独或组合使用。采用双分支架构和分阶段训练策略,在运动控制精度上比现有技术提升53%以上,为视频制作提供了前所未有的灵活性和精确度。
英国国王学院研究团队开发了潜在精炼解码(LRD)技术,解决了AI文本生成中的速度与准确性平衡难题。该方法通过两阶段设计模仿人类思考过程:先让AI在连续空间中"深思熟虑",保持多种可能性的混合状态,然后"果断行动",逐步确定答案。实验显示,LRD在编程和数学推理任务中准确性提升最高6.3个百分点,生成速度提升最高10.6倍,为AI并行文本生成开辟了新路径。
清华大学团队开发的ViSurf是一种创新的大型视觉语言模型训练方法,巧妙融合了督导式学习和强化学习的优势。该方法通过将标准答案整合到强化学习过程中,让AI既能从正确答案中学习又能保持自主推理能力。实验显示ViSurf在多个视觉任务上显著超越传统方法,特别是在处理模型知识盲区时表现突出,同时有效避免了灾难性遗忘问题,为AI训练提供了更高效稳定的新范式。