微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

百度大脑3.0升级详解“多模态深度语义理解”

百度大脑

百度大脑3.0升级详解“多模态深度语义理解”

作者：科技行者

2018-07-04 22:45

分享至：

百度AI开发者大会（Baidu Create 2018）上，百度高级副总裁、AI技术平台体系（AIG）总负责人王海峰发布百度大脑3.0，并指出，百度大脑3.0的核心是“多模态深度语义理解”，包括数据的语义，知识的语义，以及图像、视频、声音、语音等各方面的理解。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2018-07-04 22:45 • 科技行者

科技行者 7月4日北京消息： 7月4日召开的百度AI开发者大会（Baidu Create 2018）上，百度高级副总裁、AI技术平台体系（AIG）总负责人王海峰发布百度大脑3.0，并指出，百度大脑3.0的核心是“多模态深度语义理解”，包括数据的语义，知识的语义，以及图像、视频、声音、语音等各方面的理解。

图片备注

多模态深度语义理解如何在技术上实现？拥有多大的能量？它将如何被应用来改变我们的生活？当天下午的百度大脑论坛中，百度大脑3.0的核心技术一一“亮相”，为开发者们带来一场技术盛宴。

可容纳1000人的会场座无虚席，开发者们甚至席地而坐，或者站在会场最后听完整场分享。一位开发者表示，“干货太多、时间太少，回去要找回放视频好好消化一下。”

从“看清听清”到“看懂听懂”

“多模态深度语义理解能让机器听清、看清，更能深入理解它背后的含义，深度地理解真实世界，进而更好地支撑各种应用。”王海峰表示。

视觉语义化可以让机器从看清到看懂视频，并提炼出结构化语义知识。百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤介绍，视觉语义化技术首先识别人、物体和场景，同时捕捉它们之间的行为和关系，通过时序化、数字化、结构化的方式形成语义知识，最终结合领域和场景进行智慧推理，落地行业应用。比如在零售领域，它可以准确判断每个人的动作、行为，真正实现顾客拿起商品就走。未来，视觉语义化技术还可进一步延展，它结合新型的传感器和AI芯片，可以在感知层面和计算层面得到大幅提升；结合手机可以带给用户更佳地使用体验。未来，百度视觉语义化技术将在百度AI开放平台中开放给开发者使用。

语音技术的升级则让机器更好地听懂世界。百度语音技术部总监高亮表示，百度基于远场的语音语义一体化技术取得重大突破，为业界提供更顶尖的远场语音技术。语音语义一体化将远场交互中高频Query识别准确率提升10个点，并保持普通Query识别率不降；多语种混合声学建模基于Deep Peak2大幅提升中英文混合Query识别准确率，相对错误率比业界最好竞品降低20%；新升级的TTS技术业界首创传统拼接技术与Wavenet技术融合方案，保证合成质量的同时大大降低成本，让大规模应用落地成为现实。此外，百度重磅发布远场语音技术低成本解决方案“度小云”，它基于Deep Peak V2语音识别技术、语音语义一体化技术及LSTM-VAD深度学习语音切分技术，实现业界领先的五级唤醒技术，并拥有基于Wavenet的精致音库，支持远场优化的音频通信技术。未来开发者可以平等便捷地一站式获取百度远场语音能力。

想要让机器像人一样拥有智能，将语言变成知识必不可缺。百度AI技术平台体系执行总监吴甜表示，百度自然语言处理技术经过多年的发展，已形成全面、前沿的格局。百度知识图谱已发展为复杂、多元、全面的多元语义知识图谱，包含实体图谱、行业图谱、事件图谱、关注点图谱、多媒体图谱，其中实体图谱已经能够覆盖通用需求中90%的实体及其属性。在阅读理解技术上，百度大脑已经阅读了千亿量级的文章，相当于6万个中国国家图书馆的藏书，并由此积累了亿级实体、千亿事实的知识，并通过“学习”真实应用每天产生的知识不断优化。在对话理解方面，百度理解与交互技术平台UNIT升级至2.0，进一步增强冷启动能力，支持像人类一样在对话当中学习，同时开放了第一个工业级对话系统开源框架，降低搭建门槛，让开发者无缝对接云端。百度将持续开源新的技术，提供更灵活便捷的方案，推动自然语言理解技术的创新与发展。

夯实基础：数据、算法、算力并驾齐驱

数据、算法、算力是影响人工智能技术发展的重要因素。主论坛中，王海峰表示百度大脑3.0首次将芯片纳入技术体系，带动百度大脑算力爆发式增长。百度自主研发的中国第一款云端全功能AI芯片“昆仑”也在会上首次亮相。未来，AI芯片将与百度自主研发的PaddlePaddle深度学习框架相结合，推动AI行业生态快速发展。

百度在2016年正式开源的PaddlePaddle，是最适合中国开发者的深度学习框架。主论坛中，王海峰发布PaddlePaddle3.0，下午，百度AI技术生态部总经理喻友平对此进行了详细解读。PaddlePaddle3.0包括完整的核心框架，以及AI Studio、AutoDL、EasyDL等可以让开发者平等便捷获取顶尖AI能力的平台。PaddlePaddle3.0核心框架对服务器版本以及移动端版本进行了全面优化，PaddlePaddle Fluid提供丰富的满足常见主流模型搭建需求的API，支持广泛的模型搭建，训练Runtime可以满足各类型的模型训练需求；PaddlePaddle Serving可灵活适配多种预测引擎；PaddlePaddle Mobile集成百度移动端预测的实践经验，提供多平台支持。

PaddlePaddle3.0中，AutoDL备受关注。百度大数据（北京）实验室主任浣军介绍，AutoDL能更高效自动搜索神经网络结构，开发者无需特殊硬件设备可以快速得到高质量模型。AutoDL提供多种能力，支持设计全新深度学习网络结构，以及优化现有深度学习网络结构及参数，同时能够适配特定任务场景。

海量数据爆发式增长，发掘数据价值成为众多行业的普遍需求。百度大数据部总监郭谢表示，百度已形成从数据到数据工程、数据科学、数据产品再到行业方案的大数据产品技术栈，基于大数据特性，从生产资料和生产工具两方面促进产业发展。为了最大程度保证数据安全，百度正式发布大数据众智开放平台“点石”，基于全球领先的百度AI技术，全方位保障数据安全，并逐步开放工具能力，为行业数据安全赋能。

现场，百度启动了多项大赛。百度之星开发者大赛将如期回归，此外还有基于PaddlePaddle的中国高校计算机大赛人工智能创意赛、KG-知识抽取赛、交通预测赛、无人车系列大赛，以及商家招牌的分类与检测、人工智能加速器应用与设计等大数据比赛。百度方面表示，欢迎各路高手挑战，通过大赛携手推动整个AI产业的发展。

业内人士评价，百度在推动技术落地的同时不断反哺技术升级，如今已成为国内人工智能领域的领航者。百度大脑升级至3.0，也标志着百度AI技术的一次跨越式升级，正如王海峰在开场中所强调，“百度AI能力的核心是百度大脑，百度大脑3.0是百度AI能力的集大成者。”。基于百度大脑持续突破的技术实力，百度有能力把顶尖的AI技术提供给中国开发者、企业，更让每个开发者和企业都能平等获取顶尖AI能力，继而让AI在中国遍地开花。

百度大脑

分享至