2026 年 3 月 31 日 星期二
  • 登录
  • 注册
周天财经
广告
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
周天财经
没有结果
查看所有结果
首页 黄金

阿里云 Qwen3 开源 8 款 「混合推理模型」

2025 年 4 月 29 日
在 黄金
阅读时间: 1 min read
阅读:675
A A


【TechWeb】4 月 29 日消息,今日阿里云 Qwen3 正式发布并全部开源 8 款混合推理模型。

此次开源包括两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参),以及 Qwen3-30B-A3B(300 亿总参数、30 亿激活参数);以及六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace 等平台下载模型并商用,支持 Apache2.0 协议开源,也可以通过阿里云百炼调用 Qwen3 的 API 服务,

个人用户可立即通过通义 APP 直接体验 Qwen3,夸克也即将全线接入 Qwen3。

Qwen3 模型支持 119 种语言和方言。

Qwen3 模型支持两种思考模式:1. 思考模式,适合需要深入思考的复杂问题。2. 非思考模式,适用于对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行 「思考」 的程度。这两种模式的结合大大增强了模型实现稳定且高效的 「思考预算」 控制能力,让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

据介绍,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。性能表现超 OpenAI-o1、DeepSeek-R1 等大模型。

小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B10%,表现更胜一筹, Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

对于部署,阿里云推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。

广告


【TechWeb】4 月 29 日消息,今日阿里云 Qwen3 正式发布并全部开源 8 款混合推理模型。

此次开源包括两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参),以及 Qwen3-30B-A3B(300 亿总参数、30 亿激活参数);以及六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace 等平台下载模型并商用,支持 Apache2.0 协议开源,也可以通过阿里云百炼调用 Qwen3 的 API 服务,

个人用户可立即通过通义 APP 直接体验 Qwen3,夸克也即将全线接入 Qwen3。

Qwen3 模型支持 119 种语言和方言。

Qwen3 模型支持两种思考模式:1. 思考模式,适合需要深入思考的复杂问题。2. 非思考模式,适用于对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行 「思考」 的程度。这两种模式的结合大大增强了模型实现稳定且高效的 「思考预算」 控制能力,让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

据介绍,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。性能表现超 OpenAI-o1、DeepSeek-R1 等大模型。

小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B10%,表现更胜一筹, Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

对于部署,阿里云推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。

Related articles

长沙今日黄金价格多少钱一克 (2026 年 3 月 26 日)

2026 年 3 月 31 日

贵金属市场骤然变脸 牛市终结还是借机洗盘?

2026 年 3 月 30 日


【TechWeb】4 月 29 日消息,今日阿里云 Qwen3 正式发布并全部开源 8 款混合推理模型。

此次开源包括两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参),以及 Qwen3-30B-A3B(300 亿总参数、30 亿激活参数);以及六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace 等平台下载模型并商用,支持 Apache2.0 协议开源,也可以通过阿里云百炼调用 Qwen3 的 API 服务,

个人用户可立即通过通义 APP 直接体验 Qwen3,夸克也即将全线接入 Qwen3。

Qwen3 模型支持 119 种语言和方言。

Qwen3 模型支持两种思考模式:1. 思考模式,适合需要深入思考的复杂问题。2. 非思考模式,适用于对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行 「思考」 的程度。这两种模式的结合大大增强了模型实现稳定且高效的 「思考预算」 控制能力,让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

据介绍,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。性能表现超 OpenAI-o1、DeepSeek-R1 等大模型。

小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B10%,表现更胜一筹, Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

对于部署,阿里云推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。

广告


【TechWeb】4 月 29 日消息,今日阿里云 Qwen3 正式发布并全部开源 8 款混合推理模型。

此次开源包括两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参),以及 Qwen3-30B-A3B(300 亿总参数、30 亿激活参数);以及六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace 等平台下载模型并商用,支持 Apache2.0 协议开源,也可以通过阿里云百炼调用 Qwen3 的 API 服务,

个人用户可立即通过通义 APP 直接体验 Qwen3,夸克也即将全线接入 Qwen3。

Qwen3 模型支持 119 种语言和方言。

Qwen3 模型支持两种思考模式:1. 思考模式,适合需要深入思考的复杂问题。2. 非思考模式,适用于对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行 「思考」 的程度。这两种模式的结合大大增强了模型实现稳定且高效的 「思考预算」 控制能力,让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

据介绍,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。性能表现超 OpenAI-o1、DeepSeek-R1 等大模型。

小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B10%,表现更胜一筹, Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

对于部署,阿里云推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。

相关 文章

长沙今日黄金价格多少钱一克 (2026 年 3 月 26 日)

来自 周天财经
2026 年 3 月 31 日
0

2026 年 3 月 26 日长沙黄金价格查询_2...

贵金属市场骤然变脸 牛市终结还是借机洗盘?

来自 周天财经
2026 年 3 月 30 日
0

周四 (3 月 26 日) 全球贵金属市场骤然变脸...

天眼盯盘沪金资金流向:3月26日沪金主力合约资金流入1.52亿

天眼盯盘沪金资金流向:3 月 26 日沪金主力合约资金流入 1.52 亿

来自 周天财经
2026 年 3 月 30 日
0

2026 年 3 月 26 日,截至北京时间 15:...

DeepSeek服务已恢复正常

DeepSeek 服务已恢复正常

来自 周天财经
2026 年 3 月 30 日
0

【TechWeb】3 月 30 日消息,Dee...

天眼盯盘沪金持仓异动:3月26日沪金主力日内持仓增加1164手

天眼盯盘沪金持仓异动:3 月 26 日沪金主力日内持仓增加 1164 手

来自 周天财经
2026 年 3 月 30 日
0

2026 年 3 月 26 日,截至北京时间 15:...

加载更多
广告
  • 热门
  • 评论
  • 最新
神马经典投研: 集资讯、策略、研报一站式期货投研工具

神马经典投研: 集资讯、策略、研报一站式期货投研工具

2025 年 11 月 7 日
「我们也深陷残酷价格战」,德资巨头中国区高管警告

「我们也深陷残酷价格战」,德资巨头中国区高管警告

2025 年 8 月 4 日
一周产业基金|上海市人工智能CVC基金发布;湖北百亿人形机器人母基金来了

一周产业基金|上海市人工智能 CVC 基金发布;湖北百亿人形机器人母基金来了

2025 年 8 月 4 日
「硬科技」指数携手上涨,半导体设备ETF易方达(159558)、芯片ETF易方达(516350)等产品助力布局板块龙头

基民懵了!这个火爆的板块年内涨超 37%,主力却借道 ETF 狂抛逾 400 亿元

2025 年 9 月 20 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

4
Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

3
Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

2
Lesson 1: Basics Of Photography With Natural Lighting

New Cryptocurrency That Will Kill Of Bitcoin

2

债市日报:3 月 30 日

2026 年 3 月 31 日

长沙今日黄金价格多少钱一克 (2026 年 3 月 26 日)

2026 年 3 月 31 日
关税冲击下,苹果预计在2025年假日季度多支付14亿美元

开放第三方接入,Siri 彻底大变样,苹果终于放下执念

2026 年 3 月 31 日
跨越AI鸿沟:构建企业AI应用价值评估体系

跨越 AI 鸿沟:构建企业 AI 应用价值评估体系

2026 年 3 月 31 日
  • 隐私政策
  • 联系我们
  • 关于周天
  • 登录
  • 注册
投诉建议:+86 13326565461

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

欢迎回来!

在下面登录您的帐户

忘记密码? 注册

创建新帐户!

填写以下表格进行注册

所有项目需要填写。 登录

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录

用户登录

还没有账号?立即注册

用户注册

已有账号?立即登录