英伟达掌舵人黄仁勋,在GTC2017上再掀京城“AI风云”。
▲ NVIDIA CEO 黄仁勋
上场后“老黄”直接开怼,终于说出了人们憋在心中许久的结论——摩尔定律已终结。
▲ 两股力量推动计算领域的未来
但,NVIDIA的GPU计算为整个行业指出了前进的道路。
他指出,设计人员无法再创造出可以实现更高之灵系并行性的CPU架构;晶体管数每年增长50%,但CPU的性能每年仅增长10%。而NVIDIA的GPU弥补CPU的不足,加速处理高强度计算负载。
深度学习另一大“杀伤性武器”:CUDA
CUDA是一种革命性的计算架构,它将专用功能ASIC的性能与通用编程模型相结合,使开发人员实现多种算法。目前CUDA开发人员的数量在5年里增长了14倍超过60万,下载量达到180万。
▲ 适用于全球开发人员的NVIDIA AI
AI是NVIDIA CUDA GPU的“杀手级应用”,AI取得惊人进步。
阿里巴巴、百度和腾讯已在各自的云服务中采用NVIDIA Volta GPU。
华为、浪潮和联想已采用NVIDIA基于HGX的GPU服务器。
此外,NVIDIA还在为全球开发员人配置强大AI工具,全力推进“统一架构”CUDA GPU计算。
AI推理是下一个巨大挑战,重磅发布 TensorRT 3
AI推理平台必须具备可编程性,高性能,且支持庞大和复杂的网络。
随着智能机器的爆发性增长,AI会将智能注入到2000万台云服务器、上亿台汽车和制造机器人中。所以,AI推理平台必须可扩展,以解决海量计算的性能、功耗和成本需求。
▲ 宣布NVIDIA TensorRT 3
于是,老黄又来搞事了。
宣布NVIDIA TensorRT 3,全球首款可编程AI推理加速器。
TensorRT是一款适用于CUDA GPU的优化神经网络编译器,它可利用CUDA深度学习指令集创建运行时。从云、数据中心、PC、汽车到机器人,TensorRT皆能在NVIDIA全系列平台便宜出最优运行时。
▲ 运行在 V100上的 TensorRT在处理图像时可实现7ms的延时
运行的Volta上的TensorRT3在图像分类方面,比最快的CPU还要快40倍,在语言翻译方面则要快140倍。
搭配 Tesla V100 GPU 加速器的 TensorRT 每秒能够识别多达 5700 张图片,而如今所用的 CPU 则每秒仅能识别 140 张图片。
AI城市是一个巨大的AI推理挑战,它可能需要使用大约1000万个Tesla V100 GPUs来监控10亿台摄像头。
▲ NVIDIA AI城市-助力中国建设更智慧、更安全的城市
NVIDIA将携手海康威视共建AI城市。此外,大华、华为和阿里巴巴都提供基于NVIDIA平台的AI视频解决方案。
AI另一重头戏:自动驾驶汽车
NVIDIA DRIVE是一个为自动驾驶行业带来变革的端到端平台。NV自动驾驶计算机可以支持L3、L4和L5级。开放软件栈包含从ASIL-D OS、深度学习、计算机视觉 SDK 到自动驾驶应用。
▲ 开放的自动驾驶计算平台
DRIVE AV是NVIDIA开发的自动驾驶应用,环绕摄像头、雷达和激光雷达的传感数据融合。多种深度学习和计算机视觉将为L4和L5级别自动回家是技术提供所需的多样性和冗余性。
目前,145家初创公司正在研制基于NVIDIA DRIVE的自动驾驶汽车、卡车、高清制图及服务。
推全球首款自主机器处理器 Xavier
NVIDIA设计了全球首款自主机器的处理器,命名Xavier。
▲ 全球首款自主机器处理器
它是迄今为止最为复杂的片上系统,将于18年第一季度早期接触合作伙伴提供,在第四季度全面推出。
京东X选择 NVIDIA实现其自主机器,采用Jetson平台。而Xavier将成为下一代Jetson的片上系统(SOC)。
▲ 最后,谢谢各位合作伙伴AND老板们的支持!
老黄Keynote总结:计算新纪元,就是要省钱!
NVIDIA Tesla V100AI平台已经被中国领军的IT公司采用,包括阿里巴巴、百度、腾讯、华为、浪潮和联想。
业内首创的NVIDIA可编程推理加速平台已被阿里巴巴、百度、腾讯、科大讯飞和京东采用。
NVIDIA AI城市平台已被阿里巴巴、海康威视、大华和华为采用,以解决最大规模的AI和推理难题之一。
NVIDIA DRIVE——引领自动驾驶变革的开放平台,已被145家自动驾驶初创公司采用。
NVIDIA“Xavier”——全球首款自主机器处理器将在第一季度发布样片,并将揭开人工智能时代的新篇章。
好文章,需要你的鼓励
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。
纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。