北京——2025年3月11日 亚马逊云科技宣布,DeepSeek-R1现已作为完全托管的无服务器大语言模型(LLM)在Amazon Bedrock上正式可用, 亚马逊云科技是首个将该模型作为完全托管服务推出的云服务提供商。DeepSeek-R1是人工智能初创公司深度求索推出的一系列模型之一。它是公开可用模型,在处理复杂任务时具有高精度的复杂推理能力和对上下文的深度理解。

DeepSeek在过去几个月一直是业界关注的焦点,其快速发展的态势及其训练技术受到全球媒体的广泛报道,据报道这些技术使其模型比同类产品的成本降低了90-95%,具有更高的性价比。
此次的发布进一步扩展了客户在Amazon Bedrock上使用DeepSeek-R1及其蒸馏版本(即经过训练、类似于DeepSeek-R1的小型模型)的方式。现在,亚马逊云科技的客户可以在Amazon Bedrock上轻松访问完全托管的、无服务器的DeepSeek-R1模型,并将其应用于企业级部署。
任何客户均可利用其强大的功能解决复杂的问题、编写代码、处理数据、分析数据等。完全托管的方式使得客户无需担心任何背后复杂的技术设置或运维。通过在Amazon Bedrock上使用DeepSeek-R1,客户还可以受益于亚马逊云科技企业级的安全性,包括数据加密和严格的访问控制,从而确保客户的数据隐私与合规。客户可以完全控制自己的数据,并可以设置如Amazon Bedrock Guardrails等亚马逊云科技推荐的保护措施,以检测和防止模型幻觉。
此前,DeepSeek-R1已在Amazon Bedrock Marketplace上推出,客户可使用自己管理的基础设施运行该模型。此外,客户还可以通过Amazon Bedrock自定义模型导入功能,上传自己微调的DeepSeek-R1蒸馏版Llama模型,将其作为完全托管的模型运行,该功能使客户通过单一API导入和使用其自定义模型以及现有模型。
自1月下旬该模型推出以来,已有数千名客户使用Amazon Bedrock的自定义模型导入功能部署了DeepSeek-R1模型。

如果将DeepSeek-R1拟人化,他们会是一位专家级软件工程师,能够轻松地用Python编写代码、用通俗易懂的语言解释复杂算法,或者摇身一变,轻松撰写关于经典哲学家的论文,甚至可将项目需求翻译为中文供国际团队使用。特别值得一提的是,他们全天候可用,并且丝毫不介意被反复询问上百遍。
亚马逊云科技生成式AI副总裁Vasi Philomin表示:“我们很高兴将DeepSeek-R1引入Amazon Bedrock,它是一款非常先进的模型,不但显著降低了推理成本,同时还具备前沿推理性能。通过与Amazon Bedrock Guardrails等功能结合使用,客户可以实施AI安全护栏,同时获得Amazon Bedrock提供的内置安全与隐私保护。借助这种完全托管的实现方式,客户能够以无服务器按token付费的模式使用该模型,帮助他们无需管理任何基础设施即可实现从实验到生产的规模扩展。”
通过将DeepSeek-R1作为完全托管的无服务器模型在Amazon Bedrock中提供,亚马逊云科技持续为广泛的客户提供行业领先的生成式AI模型的最新创新,无论是初创公司还是大型企业,无论其技术能力如何。
亚马逊云科技通过提供来自业界领先AI公司广泛的完全托管的模型选择,持续赋能企业根据自身需求选择合适的工具,并成为客户构建和扩展生成式AI最便捷的方式。
亚马逊云科技强烈建议客户将Amazon Bedrock Guardrails和Amazon Bedrock模型评估功能与DeepSeek-R1结合使用,以保护其生成式AI应用程序。Amazon Bedrock Guardrails就像高速公路上的护栏能防止车辆偏离道路一样,有助于防止应用程序生成有害或不恰当的内容。这包括屏蔽攻击性语言、露骨的内容或其他被认为不适合最终用户的内容,以及识别和删除个人数据以保护用户隐私。
此外,客户还可以根据公司政策或行业法规设置特定规则。评估工具则可帮助客户评估AI模型在特定需求下的表现。如需了解更多信息,请参阅Amazon Bedrock Guardrails和Amazon Bedrock评估工具。
欲了解更多关于DeepSeek-R1的功能、如何部署模型以及如何将DeepSeek-R1与Amazon Bedrock Guardrails等功能集成,请访问亚马逊云科技新闻博客或相关DeepSeek-R1 in Amazon Bedrock产品页面。
用户现在就可以在Amazon Bedrock控制台中开始使用DeepSeek-R1。
关于亚马逊云科技
自2006年以来,亚马逊云科技(Amazon Web Services)一直以技术创新、服务丰富、应用广泛而享誉业界。亚马逊云科技一直不断扩展其服务组合以支持几乎云上任意工作负载,目前提供超过240项全功能的服务,涵盖计算、存储、数据库、网络、数据分析、机器学习与人工智能、物联网、移动、安全、混合云、媒体,以及应用开发、部署与管理等方面;基础设施遍及36个地理区域的114个可用区,并已公布计划在新西兰和沙特阿拉伯等新建4个区域、12个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构,都信赖亚马逊云科技,通过亚马逊云科技的服务支撑其基础设施,提高敏捷性,降低成本。要了解更多关于亚马逊云科技的信息,请访问:www.amazonaws.cn。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。