亚马逊云科技致力于成为运行开放权重模型的最佳平台,在Amazon Bedrock上新增五个模型选项,持续丰富模型选择,进一步满足客户需求。
主要亮点:
北京——2025年9月19日 亚马逊云科技宣布,在Amazon Bedrock上新增Qwen3和DeepSeek-V3.1开放权重模型,进一步扩展Amazon Bedrock上完全托管的行业领先模型阵容,这些模型现已在全球范围内正式可用。
亚马逊云科技致力于成为运行开放权重模型的最佳平台,此次新增模型进一步扩展了Amazon Bedrock上现已丰富的开放权重模型选择,Amazon Bedrock上其他开放权重模型还包括来自Meta、Mistral AI和OpenAI的模型。此次发布进一步体现了亚马逊云科技为客户提供前沿AI技术广泛选择的承诺,让客户能够根据具体使用场景选择最适合的模型,同时享受亚马逊云科技在安全、隐私保护和可靠性等方面的优势。
通过在Amazon Bedrock上使用这些模型,客户可以获得企业级的安全保障,包括数据加密和严格的访问控制,帮助客户保持数据隐私和满足合规要求。客户对其数据拥有完全控制权,这意味着亚马逊云科技不会与模型提供商共享客户的模型输入和输出数据,这些数据也不会用于基础模型的改进。此外,客户还可以设置安全保障措施,如亚马逊云科技推荐的Amazon Bedrock Guardrails来检测和防止模型幻觉。
亚马逊云科技始终相信为客户提供丰富多样的专有和开放权重AI模型选择,对释放客户使用生成式AI进行创新至关重要。开放权重模型让开发者能够深入了解模型"配方", 不仅增强了客户的模型定制能力以进行创新,同时提升性价比。
亚马逊云科技客户现可使用四个Qwen3系列开放权重模型。这些模型具备多步骤工作流规划的能力,可与工具和API集成,并能在单个任务中处理长上下文窗口,其中两个通用模型还提供"思考"和"非思考"推理模式。
如果把Qwen3系列模型拟人化,Qwen3-Coder系列就像是那些注重细节的朋友,他们能够耐心地按照复杂的家具组装说明,一步步将散落的零件组装成一个完美的书柜,同时还能清晰地解释每个步骤。而通用型的Qwen3模型则像一个精通多国语言的大家庭,他们不仅能流利地使用数十种语言交流,还拥有百科全书般的知识储备,无论是讲解科学概念还是创作故事都游刃有余。他们可以就几乎任何话题展开深入对话,并且能记住之前对话中的每个细节,不管这段对话发生在多久之前。
最新的DeepSeek 模型 DeepSeek-V3.1提供混合推理能力,在快速响应和深度、透明的思考间实现平衡。
如果将DeepSeek-V3.1拟人化,它就像是擅长解决问题的好友,会通过逻辑推理系统地分解挑战,同时根据问题的复杂程度调整处理方式。
亚马逊云科技Amazon Bedrock总监Luis Wang表示:"开放权重模型代表着AI创新的重要前沿,这也是为什么我们不断投入使亚马逊云科技成为安全、规模化且具有成本效益地运行这些模型的最佳平台。我们认为没有一个模型能适合所有使用场景...很多客户喜欢使用开源模型,而开源模型的一大优势在于它能为用户提供更大的灵活性去探索和使用。"
数据详解
开放权重模型代表着AI在透明度和灵活性方面的重大进步。你可以将它们想象成一个汤底,虽然本身已经很美味,但厨师们可以在配方基础上添加更多食材,为最终的汤品增添层次感和复杂性。同样地,客户可以研究这个"配方",根据自己的需求进行调整,甚至在这个基础上进行创新。因此,开放权重模型正在通过以下几个方面重塑生成式AI的未来。
亚马逊云科技认为为客户提供多元化的AI模型选择,是释放生成式AI全部潜力的关键。例如,不久前我们在Amazon Bedrock中引入了OpenAI的开放权重模型,今天我们进一步将更多模型的可用性扩展到每个拥有亚马逊云科技区域的大洲,包括美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、亚太地区(东京)、亚太地区(孟买)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(米兰)、欧洲(斯德哥尔摩)和南美洲(圣保罗)。
随着我们通过Amazon Bedrock等服务让更多强大的开放权重模型变得触手可及,以往仅限于技术资源和基础设施雄厚的企业才能实现的解决方案,现在那些即便没有专业AI团队的组织也能够部署。这反过来将加速医疗健康、金融服务、制造业和无数其他行业的创新,实现更先进的自动化工作流、科学研究辅助、复杂数学分析和业务流程优化。
欲了解更多,可访问Qwen3和DeepSeek-V3.1。登录Amazon Bedrock console,即刻体验这些开放权重模型。
好文章,需要你的鼓励
本文介绍了由南方科技大学等机构于2026年4月发表的研究(arXiv:2604.08865),提出了名为SPPO的大模型推理训练新方法。该方法将推理任务重新建模为"序列级情境赌博机",用一个轻量级价值模型预测题目难度,以单次采样替代GRPO的多次采样,解决了标准PPO的"尾部效应"问题。实验显示,SPPO在数学基准测试上超越GRPO,训练速度提升约5.9倍,配合小尺寸价值模型还能显著降低显存占用。
这项由香港科技大学数学系完成的研究(arXiv:2604.10465,2026年ICLR博客论文赛道)提出了一种从朗之万动力学视角理解扩散模型的统一框架。研究指出,扩散模型的前向加噪和逆向去噪过程,本质上是朗之万动力学这一"分布恒等操作"被拆成了两半。在这个视角下,VP、VE-Karras和Flow Matching等不同参数化的模型可被精确互译,SDE与ODE版本可被统一解释,扩散模型相对VAE的理论优势得以阐明,Flow Matching与得分匹配的等价性也得到了严格论证。
中国人民大学高岭人工智能学院等机构联合开发了AiScientist系统,旨在让AI自主完成机器学习研究的完整工程流程,包括读论文、搭环境、写代码、跑实验和迭代调试,全程无需人工干预。系统核心设计是"薄控制、厚状态":由轻量指挥官协调专业代理团队,通过"文件即通道"机制将所有中间成果持久化存储,使每轮工作都能建立在前一轮积累的基础上。在PaperBench和MLE-Bench Lite两个基准上,系统表现显著优于现有最强对比系统,论文发布于2026年4月。
这项由字节跳动发布的研究(arXiv:2604.13030)提出了生成式精化网络(GRN),一套模仿人类画家"边画边改"直觉的视觉生成新框架。其核心包括两项创新:层级二进制量化(HBQ)通过多轮二分逼近实现近乎无损的离散图像编码,以及全局精化机制允许模型在每一步对整张图像的所有位置重新预测并随时纠错,从根本上解决了自回归模型的误差积累问题。配合基于熵值的自适应步数调度,GRN在ImageNet图像重建(rFID 0.56)和生成(gFID 1.81)上均创下新纪录,并在文本生成图像和视频任务上以20亿参数达到同等规模方法的领先水平。