7月15日,阿里云宣布推出第三代神龙云服务器,与上一代相比,第三代神龙云服务器的综合性能提升高达160%。
第三代神龙云服务器产品家族提供了最多208核、最大6TB内存,云盘IOPS高达 100万、网络转发高达2400万、网络带宽高达100G,均为全球最高性能水平,支持CPU、GPU、NPU、FPGA等多种计算形态,具备3分钟交付50万核vCPU的极速扩容能力,是云原生的最佳载体。
按照这些数据现实,神龙云服务器的计算性能增长,突破了摩尔定律的极限。
对此,阿里云弹性计算负责人张献涛表示,原来都是是芯片厂商、硬件厂商去做自己的硬件、芯片方面的一些迭代,软件做软件的迭代,大家很少坐在一起来共同去研究和优化接口,因为接口本身都是标准化的。 虽然标准化有标准化的好处,但是标准化没有办法把软件、硬件、芯片这些方面的深层次的能力给挖出来,所以,阿里云从2016、2017年开始,决定自己研发神龙服务器。
阿里云弹性计算负责人张献涛展示神龙云服务器核心组件
“通过软硬一体化的重新设计,可以带来的性能的提升,是超越摩尔定律的,不再是按部就班的算力提升,因为摩尔定律本身有一个业界发展的规律在左右着。”
基于最新款云服务器的阿里云第六代增强型实例,全系搭配ESSD系列云盘,存储转发能力最多提升四倍;支持10Gbps突发内网带宽,单卷延时大幅下降;性能等级按需配置,在线无损变配;同时ESSD使用门槛大幅下降50%。Mysql和Redis性能提升超过15%,Nginx性能提升达100%。配合Alibaba Cloud Linux 2 LTS,启动速度最多提升60%、运行时性能最多提升30%、稳定性最多提升50%。
此外,阿里云ECS的单实例稳定性从原来的99.95%提升到99.975%,跨AZ多实例稳定性从原来的99.99%提升到99.995%,均为全球最高水准。
过去十年,阿里云的存储性能提升了2000倍,网络性能提升了500倍,整体算力以平均每12个月翻一番的速度增长,向摩尔定律的极限发起挑战。
从最早单一的通用计算,到推出异构计算与高性能计算产品,再到今天的一系列新品,阿里云弹性计算已覆盖互联网、金融、零售等行业近300种场景,支撑了各种流量高峰:如12306的春运抢票、微博热点的暴涨流量、钉钉2小时扩容10万台云服务器等。
“随着云计算往纵深方向发展,软硬一体和云原生将成为云计算技术架构的主流。” 张献涛表示,“未来3-5年内,容器在IT架构里面占比将达到一半以上,云原生需要我们将虚拟化推向极致,实现更极致的启动速度、并发能力、部署密度等。”
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。