AI热点 8 hours ago 73 Views 0 Comments

亚马逊云科技推出 Qwen3 与 DeepSeek-V3.1 模型的完全托管服务

InfoQ
InfoQ

Published 334 Articles

北京时间 9 月 19 日,亚马逊云科技宣布,在 Amazon Bedrock 上新增 Qwen3 和 DeepSeek-V3.1 开放权重模型,进一步扩展 Amazon Bedrock 上完全托管的行业领先模型阵容,这些模型现已在全球范围内正式可用。

 

此次新增模型进一步扩展了 Amazon Bedrock 上现已丰富的开放权重模型选择,Amazon Bedrock 上其他开放权重模型还包括来自 Meta、Mistral AI 和 OpenAI 的模型,用户能够根据具体使用场景选择最适合的模型。

 

用户现可使用四个 Qwen3 系列开放权重模型。这些模型具备多步骤工作流规划的能力,可与工具和 API 集成,并能在单个任务中处理长上下文窗口,其中两个通用模型还提供"思考"和"非思考"推理模式。

 

  • Qwen3 系列模型支持多语言处理,尤其在中文和英文方面表现卓越,可帮助企业实现跨文化业务运营和内容创作。

  • Qwen3-Coder-480B-A3B-Instruct 和 Qwen3-Coder-30B-A3B 针对复杂的软件工程场景进行优化,包括代码生成和理解以及高级 Agentic 任务。这些模型不仅支持多种编程语言的代码编写,还能自主调用各类数字工具(如外部工具和应用程序)。

  • Qwen-3-235B-A22B-Instruct-2507 专为通用推理设计,在性能与效率间实现平衡,在代码、数学和通用推理等任务中都表现出色。混合专家(MoE)模型在处理每个请求时只激活部分参数,这意味着针对特定任务或问题,他们只调用相关知识,从而实现高性能和高效率。

  • Qwen3-32B(Dense)则适用于在计算资源有限情况下的计算任务和应用程序,或者需要稳定、可预测性能的场景。与 MoE 模型类似专家团队只在需要时才激活他们的特定专业知识不同,"Dense"模型通常规模更小,所有组件始终协同工作。

 

据悉,最新 DeepSeek-V3.1 提供混合推理能力,在快速响应和深度、透明的思考间实现平衡。用户可以根据需求在两种模式间切换:“思考模式”通过一步一步的解决问题,“快速响应模式”则适用于简单的问题,客户能够清晰地了解模型的决策过程。DeepSeek-V3.1 支持多语言处理,在软件开发、数学推理和数据分析等领域表现出色,能够高效解决各类编程和技术挑战。同时,该模型特别适合构建如 AI Agents 和流程自动化等 Agentic 问题解决任务。

 

Qwen3-Coder-30B-A3B-Instruct 和 Qwen3-235B-A22B-Instruct-2507 模型可即刻处理高达 262K token 的上下文长度。在单次对话中,相当于约 20 万个字符或两部完整的长篇小说的内容量。DeepSeek-V3.1 拥有 6,850 亿参数。DeepSeek-V3.1 每次任务只调用相关知识部分,在保持强大性能的同时优化了运行成本。根据Artificial Analysis,DeepSeek-V3.1 相比前代实现了显著提升,尤其是推理能力和 Agentic 技能方面。

 

亚马逊云科技认为,开放权重模型正在通过以下几个方面重塑生成式 AI 的未来。

 

  • 加速创新:用户无需从零开始,而是在现有成果基础上进行构建,从而加速创新。

  • 提升透明度:用户更好地理解 AI 的知识学习过程,提升对客户的透明度。

  • 降低使用门槛:通过 Amazon Bedrock 提供完全托管服务,用户无需组建专门的技术团队就可以使用这些模型。


亚马逊云科技 Amazon Bedrock 总监 Luis Wang 表示:“开放权重模型代表着 AI 创新的重要前沿,这也是为什么我们不断投入使亚马逊云科技成为安全、规模化且具有成本效益地运行这些模型的最佳平台。我们认为没有一个模型能适合所有使用场景……很多客户喜欢使用开源模型,而开源模型的一大优势在于它能为用户提供更大的灵活性去探索和使用。”

InfoQ

InfoQ

334 Articles 48495 Views 0 Fans

Comment (0)

睡觉动画