亚马逊云科技致力于成为运行开放权重模型的最佳平台,在Amazon Bedrock上新增五个模型选项,持续丰富模型选择,进一步满足客户需求。
主要亮点:
北京——2025年9月19日 亚马逊云科技宣布,在Amazon Bedrock上新增Qwen3和DeepSeek-V3.1开放权重模型,进一步扩展Amazon Bedrock上完全托管的行业领先模型阵容,这些模型现已在全球范围内正式可用。
亚马逊云科技致力于成为运行开放权重模型的最佳平台,此次新增模型进一步扩展了Amazon Bedrock上现已丰富的开放权重模型选择,Amazon Bedrock上其他开放权重模型还包括来自Meta、Mistral AI和OpenAI的模型。此次发布进一步体现了亚马逊云科技为客户提供前沿AI技术广泛选择的承诺,让客户能够根据具体使用场景选择最适合的模型,同时享受亚马逊云科技在安全、隐私保护和可靠性等方面的优势。
通过在Amazon Bedrock上使用这些模型,客户可以获得企业级的安全保障,包括数据加密和严格的访问控制,帮助客户保持数据隐私和满足合规要求。客户对其数据拥有完全控制权,这意味着亚马逊云科技不会与模型提供商共享客户的模型输入和输出数据,这些数据也不会用于基础模型的改进。此外,客户还可以设置安全保障措施,如亚马逊云科技推荐的Amazon Bedrock Guardrails来检测和防止模型幻觉。
亚马逊云科技始终相信为客户提供丰富多样的专有和开放权重AI模型选择,对释放客户使用生成式AI进行创新至关重要。开放权重模型让开发者能够深入了解模型"配方", 不仅增强了客户的模型定制能力以进行创新,同时提升性价比。
亚马逊云科技客户现可使用四个Qwen3系列开放权重模型。这些模型具备多步骤工作流规划的能力,可与工具和API集成,并能在单个任务中处理长上下文窗口,其中两个通用模型还提供"思考"和"非思考"推理模式。
如果把Qwen3系列模型拟人化,Qwen3-Coder系列就像是那些注重细节的朋友,他们能够耐心地按照复杂的家具组装说明,一步步将散落的零件组装成一个完美的书柜,同时还能清晰地解释每个步骤。而通用型的Qwen3模型则像一个精通多国语言的大家庭,他们不仅能流利地使用数十种语言交流,还拥有百科全书般的知识储备,无论是讲解科学概念还是创作故事都游刃有余。他们可以就几乎任何话题展开深入对话,并且能记住之前对话中的每个细节,不管这段对话发生在多久之前。
最新的DeepSeek 模型 DeepSeek-V3.1提供混合推理能力,在快速响应和深度、透明的思考间实现平衡。
如果将DeepSeek-V3.1拟人化,它就像是擅长解决问题的好友,会通过逻辑推理系统地分解挑战,同时根据问题的复杂程度调整处理方式。
亚马逊云科技Amazon Bedrock总监Luis Wang表示:"开放权重模型代表着AI创新的重要前沿,这也是为什么我们不断投入使亚马逊云科技成为安全、规模化且具有成本效益地运行这些模型的最佳平台。我们认为没有一个模型能适合所有使用场景...很多客户喜欢使用开源模型,而开源模型的一大优势在于它能为用户提供更大的灵活性去探索和使用。"
数据详解
开放权重模型代表着AI在透明度和灵活性方面的重大进步。你可以将它们想象成一个汤底,虽然本身已经很美味,但厨师们可以在配方基础上添加更多食材,为最终的汤品增添层次感和复杂性。同样地,客户可以研究这个"配方",根据自己的需求进行调整,甚至在这个基础上进行创新。因此,开放权重模型正在通过以下几个方面重塑生成式AI的未来。
亚马逊云科技认为为客户提供多元化的AI模型选择,是释放生成式AI全部潜力的关键。例如,不久前我们在Amazon Bedrock中引入了OpenAI的开放权重模型,今天我们进一步将更多模型的可用性扩展到每个拥有亚马逊云科技区域的大洲,包括美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、亚太地区(东京)、亚太地区(孟买)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(米兰)、欧洲(斯德哥尔摩)和南美洲(圣保罗)。
随着我们通过Amazon Bedrock等服务让更多强大的开放权重模型变得触手可及,以往仅限于技术资源和基础设施雄厚的企业才能实现的解决方案,现在那些即便没有专业AI团队的组织也能够部署。这反过来将加速医疗健康、金融服务、制造业和无数其他行业的创新,实现更先进的自动化工作流、科学研究辅助、复杂数学分析和业务流程优化。
欲了解更多,可访问Qwen3和DeepSeek-V3.1。登录Amazon Bedrock console,即刻体验这些开放权重模型。
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。