CNET科技资讯网 9月1日 北京消息: 9月1日,2016年百度世界大会在北京中国大饭店盛大举行。会上,百度首次向外界全面展示百度人工智能成果——“百度大脑”,并宣布对广大开发者、创业者及传统企业开放其核心能力和底层技术。开放的百度大脑,将引领整个互联网行业进入下一幕。
百度创始人、董事长兼首席执行官李彦宏在会上表示,移动互联网利用人口红利带来的增长已经逐渐见顶,互联网正在进下一幕人工智能时代,人工智能将使全社会迎来变革性的发展。
作为最早布局人工智能的技术公司之一,百度大脑已建成超大规模的神经网络,拥有万亿级的参数、千亿样本、千亿特征训练,能模拟人脑的工作机制。相比三年前2-3岁孩子的智力水平,百度大脑如今智商已经有了超前的发展,在一些能力上甚至超越了人类。
百度大脑之所以拥有如此强大的“智商”,得益于百度大脑背后强大的硬件和软件支撑。数十万台服务器构成了百度大脑的实体,几年前百度便开始自建中国最大的GPU集群,保证了百度大脑超强的计算能力。而在软件方面,搜索起家的百度具备了得天独厚的优势:全网的网页数据、十多年来累积的搜索数据,以及百亿级的图像、视频、定位数据成为了百度大脑不断学习、快速成长的养料。
会上,李彦宏详细阐释了百度大脑在语音、图像、自然语言处理和用户画像领域的前沿进展。目前,百度大脑语音合成日请求量2.5亿,语音识别率达97%。强大的语音能力,不仅可以帮助一位年轻的销售员快速成为熟练、干练的金牌销售,也可以合成一代巨星张国荣的声音,实现与粉丝13年后的”隔空对话”。
在图像能力方面,百度大脑人脸识别准确率达到99.7%;百度无人车刷新了KITTI测试的多个世界记录——在KITTI竞争最激烈的车辆检测评比中排名第一。而在最难的自然语言处理方面,度秘与知名体育评论员杨毅同台解说。用户画像领域,百度大脑拥有千万级别的用户标签体系,实现“通用与垂直领域”相结合。
语音、图像、自然语言处理和用户画像是当下人工智能领域最强大、最核心的能力。百度在这四大领域的应用,已经深入到了日常生活当中。
在时代变革大幕开启之际,为了助力广大合作伙伴全面共享AI时代,完成下一幕的转型升级,百度大脑将全面开放未来,百度大脑将与各行各业结合,衍生出不同领域的行业大脑,比如医疗大脑、交通大脑、金融大脑等等。
目前,百度大脑已经与不同领域发生了碰撞。例如,欧莱雅基于百度AR技术,在品牌营销领域做创新,实现销售突破;《魔兽》出品方传奇影业利用百度的用户画像能力,实现精准推荐,提升票房。值得一提的是,英伟达公司联合创始人兼首席执行官黄仁勋在大会现场发表了主题演讲,并携手百度联合宣布继续在无人驾驶汽车领域深化合作,双方将汇聚百度云平台、地图技术和NVIDIA汽车人工智能计算平台,创建从云服务到汽车自动驾驶的平台。
最后,百度首席科学家吴恩达公布了百度人工智能的两大开放平台:百度深度学习平台与百度大脑开放平台。与其他第三方平台相比,百度深度学习平台以更少的数据准备及训练配置,实现易学易用、性能高效;而百度大脑开放平台则向合作伙伴开放技术与培训资料,实现因智而能,促进行业发展。
百度作为最早布局人工智能领域的公司,在互联网下一幕开启之际全面开放助力传统企业和开发者升级,也是在经济新常态下促进整个社会经济发展的体现。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。