近日,浪潮正式加入SPEC(Standard Performance Evaluation Corporation)标准性能评测国际组织,与IBM、EMC、思科等IT企业共同成为国际标准化测试俱乐部的重要成员。
SPEC是国际上对系统应用性能进行标准评测的权威组织,它旨在确立、修改以及认定一系列服务器应用性能评估的标准。该组织成立于1988年,是由斯坦福大学、清华大学、微软、等全球几十所知名大学、研究机构、IT企业组成的第三方测试组织。经过多年的发展积累,拥有14项公开的标准化测试规范和模型,如SPECjbbCPU、SPECpower_ssj等众多在全球业内有广泛影响力的测试项目。该组织每年有数万项结果发布,其发布的结果一直是金融、电信、能源等关键行业用户在采购服务器、搭建信息系统时的重要参考指标,尤其在全球企业级客户中拥有极高认同度。
早在2004年,浪潮服务器参加了SPECjAppServer2002测试并刷新了最好成绩,成为第一家参与SPEC组织测试的中国服务器企业。目前,浪潮已经在SPEC发布了数十项测试结果,仅2013年至今,高端服务器天梭TS 850、天梭K1 800先后4次刷新最高测试成绩,四路服务器NF8520创造了2项最好测试成绩。浪潮在服务器性能标准化测试、服务器应用性能测试层面展现出全球领先水平。
加入SPEC组织后,浪潮的服务器性能标准评测能力将会得到更快的提高,并在全球服务器性能标准测试工作中产生深远影响。作为组织成员,浪潮将获得SPEC OSG的基准测试工具的副本和许可,以及测试软件代码,可以更为深刻的理解服务器性能测试标准的相关模型,从代码层次对应用方案进行优化,更好地提升浪潮产品的性能、应用水平,同时浪潮对服务器技术和应用的长期积淀与理解,也将深刻影响并反馈到SPEC测试的基准标准和应用中,以期更好地服务中国客户。
浪潮服务器方案和合作部总经理乔鑫表示,SPEC是服务器性能评测标准的主要制定者和推动者,该组织的相关标准在服务器产业和行业客户中具有巨大的影响力,浪潮是中国服务器的第一品牌,我们希望能够将中国客户的应用特点及时反馈到全球测试标准中,从而在产品、技术、应用角度更好的服务客户应用。浪潮是中国唯一掌握软硬件核心技术的企业,拥有天梭K1主机、云数据中心操作系统、海量存储等一系列产业核心装备。显然,随着自身技术实力的快速增长,浪潮正在全球服务器产业中产生影响,并谋求更大的技术话语权。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。