CNET科技行者 9月6日 上海消息(文/周雅):人工智能价值的“矿山”已经吸引了全球的铁锹,当然也包括数字化转型的企业。
“然而人工智能的研究和应用,至今更多地分散在单点技术上,还无法满足众多企业,特别是大中型企业的供应链、制造、经营管理等复杂生产系统的需求。”在HUAWEI CONNECT 2017的第一天,华为Cloud BU总裁兼IT产品线总裁郑叶来一句话道出企业AI的难点。
此话有迹可循。毕竟一个技术的成功,要想实现立竿见影的效果,核心少不了其商业应用落地——人工智能,某种程度上改变了60逾年来介于科学与工程学之间的尴尬地位,如今在应用层面实现了爆发,包括机器人、无人驾驶、医疗、教育等,未来的人工智能显然无孔不入。
这同时意味着,企业要想在AI时代创造更多价值,则必须将那些分散的单点技术集成起来,聚沙成塔,再以云服务的形式,将人工智能技术综合运用到复杂的企业场景中,创造商业价值。这也是企业在人工智能时代核心竞争力的表现。
要实现这些对于企业来说,挑战颇大。现在,华为发布了“企业智能(EI,Enterprise Intelligence)平台”,平台有AI技术架构,有云服务,企业可以专注于自己的业务。“华为云定位于智能社会的使能者,聚合人工智能、物联网、计算和存储等基础能力,提供创新的企业智能云服务 ,让算力释放算法之美。”郑叶来说道。
平台的底层,是异构计算平台,上层搭载了三类企业智能云服务——基础平台服务、通用服务、场景解决方案。
华为“企业智能(EI)平台“架构
· 基础平台服务:包括机器学习、深度学习、图计算,以及AI训练、推理、检索平台等。
· 通用服务:包括视觉、语音、自然语言等领域API服务。
· 场景解决方案:面向行业,与合作伙伴共同打造基于AI和云计算、物联网等技术的场景解决方案。
· 异构计算平台:华为凭借积累多年的系统工程、芯片、硬件、基础软件等基础研发能力,使能上述三类智能服务,让算力释放算法之美。
当然EI并非纸上谈兵,而是已经落地了一系列的应用场景:智能物流方面,华为对自身全球供应链进行端到端流程优化,打通从供货预测到物流、仓储到报关、运输、签收等各个环节,实现物流的智能化转型;
还有智能装箱,根据物品特征提供最佳装箱方案,而且做到集装箱3D仿真可视,整体利用率提升6%;
报关环节,将EI应用于海关遵从度分析,根据历史数据和汇率变化等,发现海关数据异常提前预警,实现报关一次通过,减少企业的货物积压风险;
在仓储环节,应用EI实现智能仓储,例如设计最佳货物摆放分类、优化提货路径和仓储空间,将华为的仓储运作效率提升10%。
再以健康医疗保险理赔为例。中国太保集团首席数字官杨晓灵介绍,通过引进OCR图像识别技术,客户将就医发票通过手机拍照上传,后台算法自动识别发票照片,自动生成结构化理算文本,并支持后续赔款支付处理。整套流程,可降低理赔人工作业成本50%以上。中国太保集团希望与华为在图像识别和深度学习能力领域加强合作,为保险行业的客户资源和应用场景提供解决方案。
深圳市交警局科技处李强处长介绍了深圳与华为联合打造的智慧交通解决方案。由人工智能平台预筛选违章图片,可提升约10倍的筛选效率,郑叶来打趣道,该解决方案的自动识别交通违章行为功能,甚至可以识别出驾驶员和乘客是否系上安全带。该方案获得了中国道路交通安全协会颁发的“2017年度道路交通安全创新产品奖”。
作为华为伙伴公有云之一,Orange Business Services的CEO Thierry Bonhomme 分享了Orange在云服务领域取得的最新进展。在欧洲核子研究中心( CERN ),华为与德国电信合作提供的公有云服务支撑了全球顶尖科学家的研究工作;依托华为提供的上千台高性能计算节点的支撑,CERN的大型强子对撞机碰撞(LHC)实验项目的总体运维成本降低2/3,上线周期由90天缩短为15天。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。