北京——2025年3月11日 亚马逊云科技宣布,DeepSeek-R1现已作为完全托管的无服务器大语言模型(LLM)在Amazon Bedrock上正式可用, 亚马逊云科技是首个将该模型作为完全托管服务推出的云服务提供商。DeepSeek-R1是人工智能初创公司深度求索推出的一系列模型之一。它是公开可用模型,在处理复杂任务时具有高精度的复杂推理能力和对上下文的深度理解。
DeepSeek在过去几个月一直是业界关注的焦点,其快速发展的态势及其训练技术受到全球媒体的广泛报道,据报道这些技术使其模型比同类产品的成本降低了90-95%,具有更高的性价比。
此次的发布进一步扩展了客户在Amazon Bedrock上使用DeepSeek-R1及其蒸馏版本(即经过训练、类似于DeepSeek-R1的小型模型)的方式。现在,亚马逊云科技的客户可以在Amazon Bedrock上轻松访问完全托管的、无服务器的DeepSeek-R1模型,并将其应用于企业级部署。
任何客户均可利用其强大的功能解决复杂的问题、编写代码、处理数据、分析数据等。完全托管的方式使得客户无需担心任何背后复杂的技术设置或运维。通过在Amazon Bedrock上使用DeepSeek-R1,客户还可以受益于亚马逊云科技企业级的安全性,包括数据加密和严格的访问控制,从而确保客户的数据隐私与合规。客户可以完全控制自己的数据,并可以设置如Amazon Bedrock Guardrails等亚马逊云科技推荐的保护措施,以检测和防止模型幻觉。
此前,DeepSeek-R1已在Amazon Bedrock Marketplace上推出,客户可使用自己管理的基础设施运行该模型。此外,客户还可以通过Amazon Bedrock自定义模型导入功能,上传自己微调的DeepSeek-R1蒸馏版Llama模型,将其作为完全托管的模型运行,该功能使客户通过单一API导入和使用其自定义模型以及现有模型。
自1月下旬该模型推出以来,已有数千名客户使用Amazon Bedrock的自定义模型导入功能部署了DeepSeek-R1模型。
如果将DeepSeek-R1拟人化,他们会是一位专家级软件工程师,能够轻松地用Python编写代码、用通俗易懂的语言解释复杂算法,或者摇身一变,轻松撰写关于经典哲学家的论文,甚至可将项目需求翻译为中文供国际团队使用。特别值得一提的是,他们全天候可用,并且丝毫不介意被反复询问上百遍。
亚马逊云科技生成式AI副总裁Vasi Philomin表示:“我们很高兴将DeepSeek-R1引入Amazon Bedrock,它是一款非常先进的模型,不但显著降低了推理成本,同时还具备前沿推理性能。通过与Amazon Bedrock Guardrails等功能结合使用,客户可以实施AI安全护栏,同时获得Amazon Bedrock提供的内置安全与隐私保护。借助这种完全托管的实现方式,客户能够以无服务器按token付费的模式使用该模型,帮助他们无需管理任何基础设施即可实现从实验到生产的规模扩展。”
通过将DeepSeek-R1作为完全托管的无服务器模型在Amazon Bedrock中提供,亚马逊云科技持续为广泛的客户提供行业领先的生成式AI模型的最新创新,无论是初创公司还是大型企业,无论其技术能力如何。
亚马逊云科技通过提供来自业界领先AI公司广泛的完全托管的模型选择,持续赋能企业根据自身需求选择合适的工具,并成为客户构建和扩展生成式AI最便捷的方式。
亚马逊云科技强烈建议客户将Amazon Bedrock Guardrails和Amazon Bedrock模型评估功能与DeepSeek-R1结合使用,以保护其生成式AI应用程序。Amazon Bedrock Guardrails就像高速公路上的护栏能防止车辆偏离道路一样,有助于防止应用程序生成有害或不恰当的内容。这包括屏蔽攻击性语言、露骨的内容或其他被认为不适合最终用户的内容,以及识别和删除个人数据以保护用户隐私。
此外,客户还可以根据公司政策或行业法规设置特定规则。评估工具则可帮助客户评估AI模型在特定需求下的表现。如需了解更多信息,请参阅Amazon Bedrock Guardrails和Amazon Bedrock评估工具。
欲了解更多关于DeepSeek-R1的功能、如何部署模型以及如何将DeepSeek-R1与Amazon Bedrock Guardrails等功能集成,请访问亚马逊云科技新闻博客或相关DeepSeek-R1 in Amazon Bedrock产品页面。
用户现在就可以在Amazon Bedrock控制台中开始使用DeepSeek-R1。
关于亚马逊云科技
自2006年以来,亚马逊云科技(Amazon Web Services)一直以技术创新、服务丰富、应用广泛而享誉业界。亚马逊云科技一直不断扩展其服务组合以支持几乎云上任意工作负载,目前提供超过240项全功能的服务,涵盖计算、存储、数据库、网络、数据分析、机器学习与人工智能、物联网、移动、安全、混合云、媒体,以及应用开发、部署与管理等方面;基础设施遍及36个地理区域的114个可用区,并已公布计划在新西兰和沙特阿拉伯等新建4个区域、12个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构,都信赖亚马逊云科技,通过亚马逊云科技的服务支撑其基础设施,提高敏捷性,降低成本。要了解更多关于亚马逊云科技的信息,请访问:www.amazonaws.cn。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。