作者|周雅
“人工智能将在人类文明进化中,发挥非常深远的作用。”7月6日,特斯拉CEO埃隆·马斯克在2023世界人工智能大会(WAIC2023)开幕式上如是说。
在约9分钟的发言中,马斯克的话题主要围绕自动驾驶、特斯拉、中国AI产业三方面来谈,其中核心观点包括:
1、机器人的数量未来将多于人类。
2、特斯拉Optimus人形机器人目前处于开发阶段。
3、特斯拉在今年晚些时候将实现完全自动驾驶。
4、特斯拉愿意开放自动驾驶技术许可给汽车制造商。
5、中国一旦下决定做事就一定能做好,AI产业也一样。
以下为马斯克发言内容实录(经编辑):
上海的朋友们,大家好!
人工智能将在人类文明进化中,发挥非常深远的作用。当前,数字计算的能力爆炸式增长,关键要考虑的一个指标是「比例」,就是数字计算和生物计算的比例。而实际上,数字计算的比例每年增高。这意味着随着时间推移,相对于机器,人类智力在地球上的总思维能力中所占的比例将越来越小。
这将是一场深刻的变革,我认为,人类正处于最深远的变革时期之一。
未来,地球上会有大量的机器人。一个值得思考的问题还是「比例」,随着时间推移,机器人与人类的比例会是多少?在将来某个时刻,二者的比例可能超过1:1,这意味着机器人的数量将超过人类数量,而且它们的计算能力要强很多。这一发展趋势已经十分明显。
积极的一面是,人类将生活在一个富足的时代,人们想要的任何商品和服务都可以立刻获得。在拥有大量机器人的未来世界里,全球的生产效率将会提高到令人难以置信的水平,这是非常大的变化。当然,我们需要非常谨慎地对待,确保机器人对人类是有益的。
我相信,特斯拉将在这一进程中扮演重要的角色。特斯拉人形机器人Optimus还在开发阶段,其目标是帮助人们完成无聊的、重复的、危险的工作,完成人类不愿做的琐碎工作。因此,它不需要很高的智能水平就可以胜任这些工作。
人工智能的一个重要应用是汽车的自动驾驶。在自动驾驶方面,特斯拉非常有兴趣将自动驾驶技术许可授权给其他汽车制造商,自动驾驶是一个非常有用的技术,可以把人们从枯燥的驾驶中解放出来,给人们更多的时间。
同时,自动驾驶将大大提升车辆的利用率。一般情况下,一辆普通乘用车每周使用时长大概是10-12个小时,多数时间都在停车场趴着,而一辆拥有完全自动驾驶能力的汽车,每周的使用时间可以达到50-60小时。所以,「完全自动驾驶汽车」比「非自动驾驶汽车」的使用率翻了将近5倍。在特斯拉,我们也想提供这样的技术,特斯拉希望将这一类技术分享给更多企业使用。
目前,特斯拉的技术已经非常接近完全自动驾驶的状态。在美国道路上进行测试的特斯拉车辆,已经很少需要人工干预了。因此,当我们驾驶一辆具备最新版本完全自动驾驶系统测试版的特斯拉,从A地到B地,几乎不需要人为操控。
我猜测,特斯拉可能在今年晚些时候就具备L4或L5级的完全自动驾驶能力。我以前也做过预测,都错了,但是我觉得此刻做的这个预测,比以往任何时候都更接近于现实。
相比自动驾驶、特斯拉人形机器人等“有局限的”人工智能,通用人工智能(AGI, Artificial General Intelligence)完全不一样。
通用人工智能是一种计算机智能,它能比人类在任何一个领域所做的都更聪明。这并非特斯拉目前专攻的领域,有其他公司正在研究。但我认为,这也是我们应该担忧的领域。这种深度人工智能,有点像是几万台、几十万台、甚至几百万台最先进的计算机,一起协作产生组合的超级智能。
我们需要有监管措施,来确保这些计算机都可以协同并有序工作,以成就一个单一的综合“超级智能” (ASI, Artificial Super Intelligence) 。
未来,“超级智能”将比人类更有能力,也同时存在着风险。我们应该尽一切可能,确保担忧的风险不会发生,迎接积极的未来。
在中国,有非常多的聪明人、智慧的人,我一直非常钦佩中国人民的智慧和干劲。中国一旦下定决心要做一件事,一定都能把这个产业做得很好,这在各个经济、各个领域都是如此,当然也包括人工智能产业。我相信,中国未来将拥有非常强大的人工智能能力,这是我的预测。
最后,感谢大会邀请我来做分享,希望我的观点对大家有帮助, 非常期待下一届能跟大家在线下见面!
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。