2026 年 3 月 31 日 星期二
  • 登录
  • 注册
周天财经
广告
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
周天财经
没有结果
查看所有结果
首页 黄金

阿里云 Qwen3 开源 8 款 「混合推理模型」

2025 年 4 月 29 日
在 黄金
阅读时间: 1 min read
阅读:675
A A


【TechWeb】4 月 29 日消息,今日阿里云 Qwen3 正式发布并全部开源 8 款混合推理模型。

此次开源包括两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参),以及 Qwen3-30B-A3B(300 亿总参数、30 亿激活参数);以及六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace 等平台下载模型并商用,支持 Apache2.0 协议开源,也可以通过阿里云百炼调用 Qwen3 的 API 服务,

个人用户可立即通过通义 APP 直接体验 Qwen3,夸克也即将全线接入 Qwen3。

Qwen3 模型支持 119 种语言和方言。

Qwen3 模型支持两种思考模式:1. 思考模式,适合需要深入思考的复杂问题。2. 非思考模式,适用于对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行 「思考」 的程度。这两种模式的结合大大增强了模型实现稳定且高效的 「思考预算」 控制能力,让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

据介绍,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。性能表现超 OpenAI-o1、DeepSeek-R1 等大模型。

小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B10%,表现更胜一筹, Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

对于部署,阿里云推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。

广告


【TechWeb】4 月 29 日消息,今日阿里云 Qwen3 正式发布并全部开源 8 款混合推理模型。

此次开源包括两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参),以及 Qwen3-30B-A3B(300 亿总参数、30 亿激活参数);以及六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace 等平台下载模型并商用,支持 Apache2.0 协议开源,也可以通过阿里云百炼调用 Qwen3 的 API 服务,

个人用户可立即通过通义 APP 直接体验 Qwen3,夸克也即将全线接入 Qwen3。

Qwen3 模型支持 119 种语言和方言。

Qwen3 模型支持两种思考模式:1. 思考模式,适合需要深入思考的复杂问题。2. 非思考模式,适用于对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行 「思考」 的程度。这两种模式的结合大大增强了模型实现稳定且高效的 「思考预算」 控制能力,让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

据介绍,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。性能表现超 OpenAI-o1、DeepSeek-R1 等大模型。

小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B10%,表现更胜一筹, Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

对于部署,阿里云推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。

Related articles

武汉今日黄金价格多少钱一克 (2026 年 3 月 26 日)

2026 年 3 月 31 日

武汉今日黄金价格多少钱一克 (2026 年 3 月 26 日)

2026 年 3 月 31 日


【TechWeb】4 月 29 日消息,今日阿里云 Qwen3 正式发布并全部开源 8 款混合推理模型。

此次开源包括两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参),以及 Qwen3-30B-A3B(300 亿总参数、30 亿激活参数);以及六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace 等平台下载模型并商用,支持 Apache2.0 协议开源,也可以通过阿里云百炼调用 Qwen3 的 API 服务,

个人用户可立即通过通义 APP 直接体验 Qwen3,夸克也即将全线接入 Qwen3。

Qwen3 模型支持 119 种语言和方言。

Qwen3 模型支持两种思考模式:1. 思考模式,适合需要深入思考的复杂问题。2. 非思考模式,适用于对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行 「思考」 的程度。这两种模式的结合大大增强了模型实现稳定且高效的 「思考预算」 控制能力,让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

据介绍,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。性能表现超 OpenAI-o1、DeepSeek-R1 等大模型。

小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B10%,表现更胜一筹, Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

对于部署,阿里云推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。

广告


【TechWeb】4 月 29 日消息,今日阿里云 Qwen3 正式发布并全部开源 8 款混合推理模型。

此次开源包括两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参),以及 Qwen3-30B-A3B(300 亿总参数、30 亿激活参数);以及六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace 等平台下载模型并商用,支持 Apache2.0 协议开源,也可以通过阿里云百炼调用 Qwen3 的 API 服务,

个人用户可立即通过通义 APP 直接体验 Qwen3,夸克也即将全线接入 Qwen3。

Qwen3 模型支持 119 种语言和方言。

Qwen3 模型支持两种思考模式:1. 思考模式,适合需要深入思考的复杂问题。2. 非思考模式,适用于对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行 「思考」 的程度。这两种模式的结合大大增强了模型实现稳定且高效的 「思考预算」 控制能力,让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

据介绍,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。性能表现超 OpenAI-o1、DeepSeek-R1 等大模型。

小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B10%,表现更胜一筹, Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

对于部署,阿里云推荐使用 SGLang 和 vLLM 等框架;而对于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 这样的工具也非常值得推荐。

相关 文章

武汉今日黄金价格多少钱一克 (2026 年 3 月 26 日)

来自 周天财经
2026 年 3 月 31 日
0

2026 年 3 月 26 日武汉黄金价格查询_2...

武汉今日黄金价格多少钱一克 (2026 年 3 月 26 日)

来自 周天财经
2026 年 3 月 31 日
0

2026 年 3 月 26 日武汉黄金价格查询_2...

长沙今日黄金价格多少钱一克 (2026 年 3 月 26 日)

来自 周天财经
2026 年 3 月 31 日
0

2026 年 3 月 26 日长沙黄金价格查询_2...

贵金属市场骤然变脸 牛市终结还是借机洗盘?

来自 周天财经
2026 年 3 月 30 日
0

周四 (3 月 26 日) 全球贵金属市场骤然变脸...

天眼盯盘沪金资金流向:3月26日沪金主力合约资金流入1.52亿

天眼盯盘沪金资金流向:3 月 26 日沪金主力合约资金流入 1.52 亿

来自 周天财经
2026 年 3 月 30 日
0

2026 年 3 月 26 日,截至北京时间 15:...

加载更多
广告
  • 热门
  • 评论
  • 最新
神马经典投研: 集资讯、策略、研报一站式期货投研工具

神马经典投研: 集资讯、策略、研报一站式期货投研工具

2025 年 11 月 7 日
「我们也深陷残酷价格战」,德资巨头中国区高管警告

「我们也深陷残酷价格战」,德资巨头中国区高管警告

2025 年 8 月 4 日
一周产业基金|上海市人工智能CVC基金发布;湖北百亿人形机器人母基金来了

一周产业基金|上海市人工智能 CVC 基金发布;湖北百亿人形机器人母基金来了

2025 年 8 月 4 日
「硬科技」指数携手上涨,半导体设备ETF易方达(159558)、芯片ETF易方达(516350)等产品助力布局板块龙头

基民懵了!这个火爆的板块年内涨超 37%,主力却借道 ETF 狂抛逾 400 亿元

2025 年 9 月 20 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

4
Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

3
Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

2
Lesson 1: Basics Of Photography With Natural Lighting

New Cryptocurrency That Will Kill Of Bitcoin

2

武汉今日黄金价格多少钱一克 (2026 年 3 月 26 日)

2026 年 3 月 31 日

武汉今日黄金价格多少钱一克 (2026 年 3 月 26 日)

2026 年 3 月 31 日
回看2025,AI的系统工程时刻:重构智能的底座与边界

回看 2025,AI 的系统工程时刻:重构智能的底座与边界

2026 年 3 月 31 日

红利板块窄幅调整,资金连续五个交易日流入红利 ETF 易方达 (515180)

2026 年 3 月 31 日
  • 隐私政策
  • 联系我们
  • 关于周天
  • 登录
  • 注册
投诉建议:+86 13326565461

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

欢迎回来!

在下面登录您的帐户

忘记密码? 注册

创建新帐户!

填写以下表格进行注册

所有项目需要填写。 登录

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录

用户登录

还没有账号?立即注册

用户注册

已有账号?立即登录