北京——2025年3月11日 亚马逊云科技宣布,DeepSeek-R1现已作为完全托管的无服务器大语言模型(LLM)在Amazon Bedrock上正式可用, 亚马逊云科技是首个将该模型作为完全托管服务推出的云服务提供商。DeepSeek-R1是人工智能初创公司深度求索推出的一系列模型之一。它是公开可用模型,在处理复杂任务时具有高精度的复杂推理能力和对上下文的深度理解。

DeepSeek在过去几个月一直是业界关注的焦点,其快速发展的态势及其训练技术受到全球媒体的广泛报道,据报道这些技术使其模型比同类产品的成本降低了90-95%,具有更高的性价比。
此次的发布进一步扩展了客户在Amazon Bedrock上使用DeepSeek-R1及其蒸馏版本(即经过训练、类似于DeepSeek-R1的小型模型)的方式。现在,亚马逊云科技的客户可以在Amazon Bedrock上轻松访问完全托管的、无服务器的DeepSeek-R1模型,并将其应用于企业级部署。
任何客户均可利用其强大的功能解决复杂的问题、编写代码、处理数据、分析数据等。完全托管的方式使得客户无需担心任何背后复杂的技术设置或运维。通过在Amazon Bedrock上使用DeepSeek-R1,客户还可以受益于亚马逊云科技企业级的安全性,包括数据加密和严格的访问控制,从而确保客户的数据隐私与合规。客户可以完全控制自己的数据,并可以设置如Amazon Bedrock Guardrails等亚马逊云科技推荐的保护措施,以检测和防止模型幻觉。
此前,DeepSeek-R1已在Amazon Bedrock Marketplace上推出,客户可使用自己管理的基础设施运行该模型。此外,客户还可以通过Amazon Bedrock自定义模型导入功能,上传自己微调的DeepSeek-R1蒸馏版Llama模型,将其作为完全托管的模型运行,该功能使客户通过单一API导入和使用其自定义模型以及现有模型。
自1月下旬该模型推出以来,已有数千名客户使用Amazon Bedrock的自定义模型导入功能部署了DeepSeek-R1模型。

如果将DeepSeek-R1拟人化,他们会是一位专家级软件工程师,能够轻松地用Python编写代码、用通俗易懂的语言解释复杂算法,或者摇身一变,轻松撰写关于经典哲学家的论文,甚至可将项目需求翻译为中文供国际团队使用。特别值得一提的是,他们全天候可用,并且丝毫不介意被反复询问上百遍。
亚马逊云科技生成式AI副总裁Vasi Philomin表示:“我们很高兴将DeepSeek-R1引入Amazon Bedrock,它是一款非常先进的模型,不但显著降低了推理成本,同时还具备前沿推理性能。通过与Amazon Bedrock Guardrails等功能结合使用,客户可以实施AI安全护栏,同时获得Amazon Bedrock提供的内置安全与隐私保护。借助这种完全托管的实现方式,客户能够以无服务器按token付费的模式使用该模型,帮助他们无需管理任何基础设施即可实现从实验到生产的规模扩展。”
通过将DeepSeek-R1作为完全托管的无服务器模型在Amazon Bedrock中提供,亚马逊云科技持续为广泛的客户提供行业领先的生成式AI模型的最新创新,无论是初创公司还是大型企业,无论其技术能力如何。
亚马逊云科技通过提供来自业界领先AI公司广泛的完全托管的模型选择,持续赋能企业根据自身需求选择合适的工具,并成为客户构建和扩展生成式AI最便捷的方式。
亚马逊云科技强烈建议客户将Amazon Bedrock Guardrails和Amazon Bedrock模型评估功能与DeepSeek-R1结合使用,以保护其生成式AI应用程序。Amazon Bedrock Guardrails就像高速公路上的护栏能防止车辆偏离道路一样,有助于防止应用程序生成有害或不恰当的内容。这包括屏蔽攻击性语言、露骨的内容或其他被认为不适合最终用户的内容,以及识别和删除个人数据以保护用户隐私。
此外,客户还可以根据公司政策或行业法规设置特定规则。评估工具则可帮助客户评估AI模型在特定需求下的表现。如需了解更多信息,请参阅Amazon Bedrock Guardrails和Amazon Bedrock评估工具。
欲了解更多关于DeepSeek-R1的功能、如何部署模型以及如何将DeepSeek-R1与Amazon Bedrock Guardrails等功能集成,请访问亚马逊云科技新闻博客或相关DeepSeek-R1 in Amazon Bedrock产品页面。
用户现在就可以在Amazon Bedrock控制台中开始使用DeepSeek-R1。
关于亚马逊云科技
自2006年以来,亚马逊云科技(Amazon Web Services)一直以技术创新、服务丰富、应用广泛而享誉业界。亚马逊云科技一直不断扩展其服务组合以支持几乎云上任意工作负载,目前提供超过240项全功能的服务,涵盖计算、存储、数据库、网络、数据分析、机器学习与人工智能、物联网、移动、安全、混合云、媒体,以及应用开发、部署与管理等方面;基础设施遍及36个地理区域的114个可用区,并已公布计划在新西兰和沙特阿拉伯等新建4个区域、12个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构,都信赖亚马逊云科技,通过亚马逊云科技的服务支撑其基础设施,提高敏捷性,降低成本。要了解更多关于亚马逊云科技的信息,请访问:www.amazonaws.cn。
好文章,需要你的鼓励
本文介绍了由南方科技大学等机构于2026年4月发表的研究(arXiv:2604.08865),提出了名为SPPO的大模型推理训练新方法。该方法将推理任务重新建模为"序列级情境赌博机",用一个轻量级价值模型预测题目难度,以单次采样替代GRPO的多次采样,解决了标准PPO的"尾部效应"问题。实验显示,SPPO在数学基准测试上超越GRPO,训练速度提升约5.9倍,配合小尺寸价值模型还能显著降低显存占用。
这项由香港科技大学数学系完成的研究(arXiv:2604.10465,2026年ICLR博客论文赛道)提出了一种从朗之万动力学视角理解扩散模型的统一框架。研究指出,扩散模型的前向加噪和逆向去噪过程,本质上是朗之万动力学这一"分布恒等操作"被拆成了两半。在这个视角下,VP、VE-Karras和Flow Matching等不同参数化的模型可被精确互译,SDE与ODE版本可被统一解释,扩散模型相对VAE的理论优势得以阐明,Flow Matching与得分匹配的等价性也得到了严格论证。
中国人民大学高岭人工智能学院等机构联合开发了AiScientist系统,旨在让AI自主完成机器学习研究的完整工程流程,包括读论文、搭环境、写代码、跑实验和迭代调试,全程无需人工干预。系统核心设计是"薄控制、厚状态":由轻量指挥官协调专业代理团队,通过"文件即通道"机制将所有中间成果持久化存储,使每轮工作都能建立在前一轮积累的基础上。在PaperBench和MLE-Bench Lite两个基准上,系统表现显著优于现有最强对比系统,论文发布于2026年4月。
这项由字节跳动发布的研究(arXiv:2604.13030)提出了生成式精化网络(GRN),一套模仿人类画家"边画边改"直觉的视觉生成新框架。其核心包括两项创新:层级二进制量化(HBQ)通过多轮二分逼近实现近乎无损的离散图像编码,以及全局精化机制允许模型在每一步对整张图像的所有位置重新预测并随时纠错,从根本上解决了自回归模型的误差积累问题。配合基于熵值的自适应步数调度,GRN在ImageNet图像重建(rFID 0.56)和生成(gFID 1.81)上均创下新纪录,并在文本生成图像和视频任务上以20亿参数达到同等规模方法的领先水平。