
下周一,两年一度的美国超级计算大会即将开幕。
在此次大会开幕前夕,IBM与美国能源部周五达成一项价值为3.25亿美元合作协议:未来IBM将为美政府机构制造两款名为“Sierra”和“Summit”的超级计算机。
据悉,IBM所制造的“Sierra”和“Summit”超级计算机,将采用新的超级计算方法,同时搭载Nvidia公司处理加速器,并运行于Mellanox公司提供的高速网络。
美国超级计算大会所关注的高端系统,占地十分庞大——有些系统占地跟篮球场大小一样,这些设备通常被美国政府机构用于汽车空气动力学研究,检测飞机设计机构弱点,以及预测新药物性能等等。
据悉,由IBM制造的这两台巨型计算机,一台将用于民用领域,部署在田纳西州的橡树岭国家实验室;另一台则用于国家核武器模式测试,部署在加州劳伦斯利弗莫尔国家实验室。Nvidia估测,如果这些设备的计算工作量由人工操作,需要300万人同时在笔记本电脑使展开。
好文章,需要你的鼓励
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。
南洋理工大学与腾讯联合研究团队开发出Rolling Forcing技术,实现AI视频实时流式生成的重大突破。该技术通过滚动窗口联合去噪、注意力锚点机制和高效训练算法三项创新,解决了长视频生成中的错误累积问题,可在单GPU上以16fps速度生成多分钟高质量视频,延迟仅0.76秒,质量漂移指标从传统方法的1.66降至0.01,为交互式媒体和内容创作开辟新可能。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。