CNET科技资讯网 5月10日 北京消息:日前,联想X6服务器平台再次创造10项行业性能基准测试世界纪录,其中,除了在6项性能测试中继续保持优势,还连续创造两项新的SAP世界纪录、一项新的Java世纪记录和一项新的SPECcpu基准测试世界纪录。至此,联想X6服务器保持的世界纪录总数达到了34项,延续了其自2014年推出以来在各种基准测试中排名第一和创造世界纪录的成绩。
联想X6解决方案为关键任务应用提供了一个强大的平台,具有快速、灵敏和弹性强的优势,能确保客户获得出色的可靠性、可管理性、可扩展性以及运行Windows或Linux的灵活性。联想System x3850 X6及x3950 X6能提供最优质的性能,最大程度保证应用正常运行。此次性能基准测试结果再一次证明,联想一直不断精进产品技术研发,利用云基础架构、大数据和分析解决方案,帮助客户实现数据中心转型。
在此次公布的10项性能基准测试记录里,联想X6收获了四项新纪录,分别是两项SAP基准测试世界纪录,包括业务处理(Business Processing)类(SAP Sales and Distribution)和大数据分析(SAP Business Warehouse Edition for SAP HANA基准测试的),一项新的Java(SPECjbb2015-Distributed)世界纪录和一项SPECcpu基准测试世界纪录。
·Windows平台上双层(two-tier)SAP Sales and Distribution标准应用基准测试中新的世界纪录。联想System x3950 X6在Windows操作系统双层SAP Sales and Distribution(SD)标准应用基准测试中创造了8插槽测试结果世界纪录,延续了公司在SAP标准应用基准测试中出色的性能表现。System x3950 X6在SAP应用和组件的硬件和数据库性能上,较上一代联想系统性能提升了28%,在E7-8890 v4处理器上提升了4%。这一测试结果表明,联想服务器在SAP环境中处理业务交易工作流程方面性能表现最为优异。
·SAP Business Warehouse Edition for SAP HANA标准应用基准测试世界纪录。配备有4颗英特尔Xeon处理器、SAP HANA 1.0及SAP NetWeaver 7.5的联想System x3850 X6在所有3个关键性能指标上都拥有了行业领先的性能,在单一节点配置中创造了13亿条记录的新纪录。SAP BW/4HANA标准应用基准测试是对SAP BW基准测试系列的最新补充。该基准测试分为3个阶段,即数据加载、查询吞吐量和查询运行时间,旨在全面利用SAP HANA的新功能来处理基准测试工作负载。联想System x3850 X6可为SAP HANA上运行的关键任务应用提供企业级可靠性和可用性。联想能为SAP HANA提供简单且可扩展的解决方案,是SAP HANA领域的全球领导者,其产品已被部署在6,800个项目中。
·面向计算密集型应用的全新SPEC CPU 2006基准测试最高得分。联想System x3850 X6 4U机架服务器在SPEC CPU2006基准测试获得最高得分。该测试使用了两颗包含24个内核的高性能英特尔Xeon E7-8894 v4处理器。x3850 X6最适合用于测量多线程计算密集型应用,如高性能计算(HPC)工作负载。利用两颗英特尔Xeon E7-8894 v4处理器、256 GB的TruDDR4内存及SUSE Linux Enterprise Server 12 SP1(x86_64),System x3850 X6获得了最高的SPECint_rate_base2006测试得分。
·SPECjbb 2015 Java业务交易基准测试中的最新总体得分世界纪录。联想的System x3850在SPECjbb2015 Distributed基准测试中取得了最出色的四处理器(4P)性能测试结果。SPECjbb 2015是一种Java Business基准测试,也是用于评估常见Java应用的服务器的性能的SPEC基准测试。在该基准测试中,x3850使用了Java HotSpot 64位Server VM(1.8.0_111版)和SUSE Linux Enterprise Server 12 SP1,取得了224,892 max-jOPS和75,274 critical-jOPS的成绩,表明x3850是在Java应用响应时间和吞吐量方面性能最出色的服务器。
联想还在一系列行业测试中取得了另外6项出色的基准测试成绩,包括SPECint 20065、SPECfp 20066、SPECvirt 20137,8、STAC-M3 Shasta Suite9和TPC-E10。值得一提的是,在用于测试和对比各种在线交易处理(OLTP)和数据库系统的性能及价格的TPC-E测试中,联想创造了4处理器测试结果新纪录:9,068.00 tpsE(transactions per second E)@ $139.85 USD/tpsE——性能比使用上一代英特尔Xeon E7 v3处理器的x3850 X6高出了整整30%。11 这是业内最高的四处理器性能。此外联想还是2P12和总体/8P13性能测试结果纪录保持者,因此进一步巩固了联想作为TPC-E基准测试和OLTP性能领导者的地位。
“今年,我们创造了30多项基准测试世界纪录。今天的测试结果充分证明了联想的X6服务器创新和技术设计在行业的领先地位,”联想服务器和存储业务集团总经理Kamran Amini说道,“这些性能测试结果不仅证明了我们拥有连续取得更大成功的能力,同时也进一步体现了联想致力研发数据中心创新技术的郑重承诺,全力以赴为客户带来令人注目的商业价值。”
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。