Uber在过去五年里花了25亿美元,但现在离自动驾驶汽车的交付仍很遥远。
今年全球公司在人工智能系统(AI)上的支出将超500亿美元,是个创纪录的投资,但绝大多数公司可能不会从中获得太多回报。
《麻省理工学院Sloan管理评论》及波士顿咨询集团(英文缩写为BCG)最近对3,000多位公司经理的人工智能支出进行了一项调查并发布报告称,到目前为止,只有10%的公司从人工智能投资获得重大财务收益。
这项研究的负责人BCG北美人工智能业务联席主管Shervin Khodabandeh表示,人工智能技术的收益并未跟上采用步伐。Khodabandeh称,“我们见到更多的人工智能活动,更多的活动也意味着在技术和数据科学的投资更多。但其影响力并没有真正改变。”
该研究报告里的结果应该会引起有些企业的担心,这些企业在AI项目不断以惊人的速度投入资金,希望能将人工智能工具用于各种领域,例如管理合同、家庭助理和自动驾驶汽车。IDC数据显示,今年全球人工智能系统的投资预计将超过500亿美元。IDC还预测,到2024年,人工智能系统投资额将达到1100亿美元。
尽管投入了数十亿美元,失败的AI项目却成了不断增加的因素。例如,IBM的Watson技术吸引了不少风险投资,一个肿瘤学项目就募得6200万美元,但项目的系统在癌症治疗上却因提出不当的建议曾被嘲讽。IBM后来降低了旗下Watson技术的优先级。亚马逊AI也由于出现歧视女性的偏见而搁置了AI招聘工具。一些较小的企业发现,构建人工智能技术比表面上看起来要更难一些,一些应该由AI驱动的虚拟助手和会议调度程序最终要依赖幕后的人工操作。
Khodabandeh表示,公司要交付达到预期结果的AI项目碰到困难,因为他们在科技和数据科学家方面的花费太多,但却没有在业务流程上做出改动致使业务从AI中受益。Khodabandeh这一结论与6月份发表的《哈佛商业评论》报告相仿。
再来看看以打车为服务的Uber公司。Uber工程师上个月得出结论,旗下的自动驾驶汽车行驶不出半英里就会遇到问题。根据The Information网站一份报告(https://www.theinformation.com/articles/infighting-busywork-missed-warnings-how-uber-wasted-2-5-billion-on-self-driving-cars)的资料,该项目的人工智能“连搞定简单的路线和简单的操作都吃力得紧”。根据一份内部备忘录资料,失败的部分原因:内部各种想法在如何实施人工智能技术方面没法达成一致。
不过由于AI在节省和改善大规模业务上存在的潜力,一众公司也不太可能很快停止对该技术的投资。BCG和麻省理工学院的研究人员发现,57%的公司表示已部署或试用了自己的AI项目,高于2018年的44%。
Khodabandeh表示,要想从这些项目获得回报,更多的AI采用者需要重新考虑如何在自己的业务中整合人工智能技术。他表示,“显然有很多炒作。有些炒作来自数据。”
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。