就如NVIDIA CEO 黄仁勋钟情穿皮夹克做主题演讲一样,今年NVIDIA不仅还是选择在CES2015预展上召开发布会,而且其重头戏也延续了去年发布会的调调——移动芯片、游戏与汽车。
对于NVIDIA在CES2015上发布Tegra K1的升级版,网友一点都不惊讶,但是名字,大家又猜错了。不是Tegar K2、也不是Tegra M1,而是Tegra X1。
Tegra X1有几大亮点不得不说,这也是它顶替了Tegra K1“核弹”头衔的原因。
NO.1:新架构 新体验
Tegra X1基于NVIDIA近期发布的Maxwell GPU架构,该架构用于全球顶级性能的游戏显卡GeForce GTX 980,可见NVIDIA对Tegra X1的重视程度,旗舰范儿。
NO.2:核心提高 性能爆表
Tegra X1采用了256核心的GPU,对比Tegra K1,其性能高出两倍。
NO.3:小尺寸 功耗低
Tegra X1的尺寸仅有拇指指甲大小,功耗约为10瓦特。
Tegra处理器是NVIDIA专为嵌入式产品、移动设备、自主机器以及汽车等应用而打造。据悉,Tegra X1 将于今年上半年开始上市。
NVIDIA在CES2014上推出的SHIELD游戏掌机获得了广大网友的热切关注,不过今年,NVIDIA并没有推出游戏机产品,不过,游戏依然占据了发布会的一部分。
黄仁勋为在发布会上向大家展示了在搭载Tegra X1芯片的平板电脑上运行Unreal Engine 4引擎“Element”Demo演示,具有大量的破坏和物理碰撞、复杂的全局光照,效果很逼真。
发布会并未透露GAMESTREAM的相关情况,黄总,下一代掌机啥时候出啊?
为什么说NVIDIA“豪赌”汽车市场呢,其一是,不管去年还是今年,NVIDIA都在CES上用大篇幅讲了汽车相关的技术,这一定是着重推广的节奏;其二,请看NVIDIA财报,2014年10月26日,NVIDIA第三季度收入12.25亿美元,创下历史新高,同比增长16%,环比增长11%,但是看业务方面,GPU显卡收入9.91亿美元,仍然超过总收入的八成,而Tegra处理器同比涨51%,占总体收入的一成以上,财报并未透露汽车领域的收入情况,这也从侧面表示,NVIDIA在汽车领域,现阶段投入要大于产出。
即便如此,NVIDIA的财报数字还是非常喜人的,不过俗话说得好,“生于忧患,死于安乐”。不仅需要保卫已有的优势,为了持续发展,还需要开拓新的蓝海,而看情况,汽车市场就是NVIDIA瞄准的蓝海。
在发布会上,NVIDIA发布了两款汽车电脑:NVIDIA DRIVE PX和NVIDIA DRIVE CX,前者用于开发自动驾驶功能,后者用于打造最先进的数字座舱系统。
NVIDIA DRIVE PX:其采用了Tegra X1芯片,计算机视觉功能可成就自动代客泊车 (Auto-Valet),让汽车可以找到泊车空间并自动泊车,无需人工干预;NVIDIA DRIVE PX可以让汽车在拥挤的停车场发现空地、自动泊车然后在智能手机发出召唤时返回原地接上驾驶员。
NVIDIA DRIVE CX:这是一款完整的软硬件解决方案,可成就先进的图形与计算机视觉功能,满足导航、信息娱乐、数字仪表组以及驾驶员监控等需要。它还可以成就环绕视觉 (Surround-Vision),实时提供无失真全局 360 度汽车视野,从而解决了盲区问题,另外还可以用数字智能后视镜完全取代物理后视镜。可选配Tegra X1或Tegra K1处理器。
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。