
CNET科技行者 9月26日 北京消息(文/黄雅琦): GTC 2017 Keynote上,NVIDIA创始人兼CEO,黄掌门不止一次提到“Save money ”。
当然,这是主会演讲“PPT闹情绪”期间,老黄为活跃气氛而讲的“玩笑话”。
玩笑声的背后,NVIDIA正在将AI推广至每个计算平台、每个架构、以及人类的每项工作中。
NVIDIA 全球副总裁兼智能机器事业部总经理 Deepu Talla
Deepu Talla,现任NVIDIA 全球副总裁兼智能机器事业部总经理,主要负责在工业机器人、商用无人机和视频分析等设备上部署AI技术。
现在,他手里掌握着NVIDIA两大最重要的应用领域:机器人和AI城市。
AI AT THE EDGE ”的主题演讲,专攻两个话题:
一,NVIDIA机器人“大脑”——详解“AI超级计算机”Jetson TX2平台;
二,AI城市,需要边缘到云的架构——详解NVIDIA Metropolis平台。
在这场近50分钟“干货”分享中,我们highlight了Deepu Talla的精彩要点:
随着深度神经网络在多种应用上取得极大成功,网络架构也变得越来越深。
在网络架构变化的同时,包括物联网在内的终端设备数量也越来越多。因为这些设备直接连接传感器数据(摄像头、麦克风、陀螺仪等),所以在终端设备上部署机器学习具有极大的吸引力。
但现在看来,顶级的机器学习系统还无法满足终端设备的现状:
1、要么把传感器数据输入到云端的大型神经网络模型;
2、要么直接在终端设备上使用简单的机器学习模型。
前者存在带宽、延时、数据隐私、网络连接这四大难题,但后者会降低系统的准确率。
为了克服这些问题,自然而然地就想到了分布式计算方法。层级分布式计算架构包括云、边缘与终端设备,NVIDIA推出端到端Training到Inference,后端服务器到前端摄像头)的深度学习平台。
Deepu Talla表示:
对训练环节中神经网络的大量数据训练,主要用的是DGX-1;
之后将训练好的数据存入到云和数据中心,这方面主要使用的是Tesla;
当然,也可以将这些数据部署到录像机和摄像头之中,这里主要使用的是Jetson计算平台。
这里他提到AI最主要的应用——机器人。
事实上,机器人早已不是单纯地用来博人眼球的噱头,诸多机器人应用已经真实落地于多个行业终端,包括医疗、零售、公共事业和交通领域等垂直行业当中。
Jetson TX2:名片大小,却是机器人的“超强大脑”
在机器人部署中,如何让机器拥有与人一样的“意识”,Deepu Talla 提到三个环节:感知、思考、行动。为了让机器人为行业输出更大能力。于是,NVIDIA 升级Jetson计算平台,推出Jetson TX2。
正是这个仅为名片大小的平台,却是机器人的“超强大脑”。
Jetson TX2是NVIDIA嵌入式计算系列产品继Jetson TK1和TX1之后的又一突破。
它所提供的性能为早前版本的两倍,即能够以两倍以上的功效运行,且功率低于7.5W。这使得Jetson TX2能够在终端应用上运行更庞大、更深度的神经网络,让设备更加智能,具有更高的精度和更快的响应时间,以执行如图像分类、导航和语音识别等任务。
Jetson十大应用场景
NVIDIA Jetson嵌入式平台对机器人,IVA等行业的助益着实不容忽视。除此之外,NVIDIA也宣布推出Isaac机器人模拟器。
NVIDIA Isaac:在虚拟环境进行AI训练和测试
NVIDIA Isaac机器人模拟器能够实现在部署前模拟现实条件对智能机器进行训练。Isaac将VR和AI这两个先进技术加以融合,可为机器人提供一个虚拟环境进行AI训练和测试。
在其构建的虚拟环境中,开发人员可通过虚拟现实技术来搭建各类测试场景,然后在几分钟内对其进行模拟,从而可以在虚拟世界中快速得到大量训练数据,然后再利用AI技术从这些数据中训练得到知识。
VR。
机器人之后,Deepu Talla 将话题转到 AI 城市。
AI城市共建:NVIDIA用AI装上“城市之眼”
“AI城市是一个巨大的AI推理挑战,它可能需要使用大约1000万个Tesla V100 GPUs来监控10亿台摄像头。 ”Deepu Talla表示。
至于为什么NVIDIA要进入到安防IVA领域,Deepu Talla表示,一方面是维护人身安全的需要;另一方面是行业需求,因为这个行业需要用到视频分析,需要进行语音辨识,这两个领域借助深度学习再合适不过。
覆盖安防全行业。
目前,NVIDIA为打造AI城市已部署NVIDIA Metropolis平台。
Metropolis于今年5月份首次发布,是一个包含各种工具和技术从终端到云端的视频分析平台,以构建覆盖交通与停车管理、执法、城市服务等各个方面更智能、更快速的AI赋能应用。
此外,NVIDIA正在与合作伙伴携手,以助力中国建设更智慧、更安全的城市为目标,加快脚步。
海康威视在端到端解决方案中采用NVIDIA平台;
大华的方案为大型活动提供了数以百计的虚拟保安;
华为的方案用于监控交通流量;
阿里巴巴的解决方案可以监控交通堵塞并改善交通状况。
下一步,挑选软件合作伙伴
Deepu Talla向科技行者透露,NVIDIA正在通过新的合作伙伴计划汇聚更多的全球最佳AI公司,以加速围绕Metropolis的新产品开发。
在GTC2017现场,NVIDIA就展示不少“中国力量”。
JDrone:高空配送
京东 X已与北京、四川、陕西和江苏等省市合作推出了试点项目,旨在将无人机用于快递、农业、搜索和救援领域。凭借拥有高性能、低能耗、小尺寸和先进视觉能力的Jetson,JDrones具有每小时100公里的航速,同时可以配送重达30公斤的包裹。其它京东无人机测试可承载多达200公斤。

海康威视:让安防“火眼金睛”
海康威视将摄像机及网络录像机与NVIDIA Jetson终端相结合,使用由NVIDIA Tesla P4 GPU加速器提供支持的云服务器,以及利用DGX-1 AI超级计算机的大规模计算能力进行训练。 监控摄像头采集到的视频信息输入系统,系统会自动分离出所有人(包括人脸、衣着甚至背影)和所有汽车(包括车牌、颜色、年款)。
关注科技行者(微信号:itechwalker),打开对话界面回复“黄仁勋”,可获得【GTC2017黄仁勋演讲】完整版高清PPT
好文章,需要你的鼓励
本文介绍了由南方科技大学等机构于2026年4月发表的研究(arXiv:2604.08865),提出了名为SPPO的大模型推理训练新方法。该方法将推理任务重新建模为"序列级情境赌博机",用一个轻量级价值模型预测题目难度,以单次采样替代GRPO的多次采样,解决了标准PPO的"尾部效应"问题。实验显示,SPPO在数学基准测试上超越GRPO,训练速度提升约5.9倍,配合小尺寸价值模型还能显著降低显存占用。
这项由香港科技大学数学系完成的研究(arXiv:2604.10465,2026年ICLR博客论文赛道)提出了一种从朗之万动力学视角理解扩散模型的统一框架。研究指出,扩散模型的前向加噪和逆向去噪过程,本质上是朗之万动力学这一"分布恒等操作"被拆成了两半。在这个视角下,VP、VE-Karras和Flow Matching等不同参数化的模型可被精确互译,SDE与ODE版本可被统一解释,扩散模型相对VAE的理论优势得以阐明,Flow Matching与得分匹配的等价性也得到了严格论证。
中国人民大学高岭人工智能学院等机构联合开发了AiScientist系统,旨在让AI自主完成机器学习研究的完整工程流程,包括读论文、搭环境、写代码、跑实验和迭代调试,全程无需人工干预。系统核心设计是"薄控制、厚状态":由轻量指挥官协调专业代理团队,通过"文件即通道"机制将所有中间成果持久化存储,使每轮工作都能建立在前一轮积累的基础上。在PaperBench和MLE-Bench Lite两个基准上,系统表现显著优于现有最强对比系统,论文发布于2026年4月。
这项由字节跳动发布的研究(arXiv:2604.13030)提出了生成式精化网络(GRN),一套模仿人类画家"边画边改"直觉的视觉生成新框架。其核心包括两项创新:层级二进制量化(HBQ)通过多轮二分逼近实现近乎无损的离散图像编码,以及全局精化机制允许模型在每一步对整张图像的所有位置重新预测并随时纠错,从根本上解决了自回归模型的误差积累问题。配合基于熵值的自适应步数调度,GRN在ImageNet图像重建(rFID 0.56)和生成(gFID 1.81)上均创下新纪录,并在文本生成图像和视频任务上以20亿参数达到同等规模方法的领先水平。