阿里巴巴推出 Qwen 3 系列 ‘混合式’ AI 推理模型

3个月前 科技 22观看
摘要 中国科技公司阿里巴巴于周一发布了 Qwen 3 系列 AI 模型,该公司声称这些模型在某些情况下可以与 Google 和 OpenAI 提供的最佳模型媲美甚至超越它们。大多数模型目前已经或将很快可通过 AI 开

中国科技公司阿里巴巴于周一发布了 Qwen 3 系列 AI 模型,该公司声称这些模型在某些情况下可以与 Google 和 OpenAI 提供的最佳模型媲美甚至超越它们。zaD喜好网-记录每日喜好的科技时尚娱乐生活

大多数模型目前已经或将很快可通过 AI 开发平台 Hugging Face 和 GitHub 在 “open” 许可 下下载。它们的参数规模从 6 亿到 2350 亿不等。参数大致对应模型解决问题的能力,通常参数越多,模型的表现越好。zaD喜好网-记录每日喜好的科技时尚娱乐生活

像 Qwen 这样由中国发展起来的模型系列的崛起,加大了对像 OpenAI 这样的美国实验室提供更强大 AI 技术的压力。同时,这也促使政策制定者实施限制措施,以限制中国 AI 公司获取训练模型所需芯片的能力。zaD喜好网-记录每日喜好的科技时尚娱乐生活

据阿里巴巴介绍, Qwen 3 模型是 “混合式” 模型,这意味着它们既可以花费较长时间 “推理” 解决复杂问题,也可以快速响应简单请求。推理使得这些模型能够有效地自我核查,与 OpenAI 的 o3 等模型类似,但代价是较高的延迟。zaD喜好网-记录每日喜好的科技时尚娱乐生活

Qwen 团队在博客中写道:“我们已将思考模式与非思考模式无缝整合,为用户提供了灵活的思考预算控制选项。此设计使用户能够更轻松地配置针对具体任务的预算。”zaD喜好网-记录每日喜好的科技时尚娱乐生活

阿里巴巴表示, Qwen 3 模型支持 119 种语言,并在近 36 万亿个 Token 的数据集上进行了训练。Token 是模型处理的原始数据单位; 100 万个 Token 约等于 75 万个单词。阿里巴巴称, Qwen 3 的训练数据包括教科书、“question-answer pairs”、代码片段、 AI 生成的数据等多种内容。zaD喜好网-记录每日喜好的科技时尚娱乐生活

阿里巴巴表示,这些改进以及其他优化大幅提升了 Qwen 3 相较于前作 Qwen 2 的性能。在编程比赛平台 Codeforces 上,最大的 Qwen 3 模型 —— Qwen-3-235B-A22B —— 刚刚超越了 OpenAI 的 o3-mini 与 Google 的 Gemini 2.5 Pro。Qwen-3-235B-A22B 在最新版本的 AIME (一个具有挑战性的数学基准测试)和 BFCL (一项评估模型 “推理” 问题能力的测试)中也超越了 o3-mini。zaD喜好网-记录每日喜好的科技时尚娱乐生活

但 Qwen-3-235B-A22B 尚未公开发布 —— 至少目前还没有。zaD喜好网-记录每日喜好的科技时尚娱乐生活

最大的公开 Qwen 3 模型 Qwen3-32B 仍与多种专有及开放的 AI 模型保持竞争优势,包括中国 AI 实验室 DeepSeek 的 R1。Qwen3-32B 在包括编码基准测试 LiveCodeBench 在内的多个测试中均超过了 OpenAI 的 o1 模型。zaD喜好网-记录每日喜好的科技时尚娱乐生活

阿里巴巴表示, Qwen 3 在调用工具能力、遵循指令以及复制特定数据格式方面表现 “出色”。除了可供下载的模型外, Qwen 3 还可以通过云服务提供商 Fireworks AI 和 Hyperbolic 获得。zaD喜好网-记录每日喜好的科技时尚娱乐生活

AI 云托管服务 Baseten 的联合创始人兼 CEO Tuhin Srivastava 表示, Qwen 3 是开放模型在追赶 OpenAI 等封闭系统趋势中的又一里程碑。zaD喜好网-记录每日喜好的科技时尚娱乐生活

他在给 TechCrunch 的声明中表示:“美国正在加大对向中国销售芯片和从中国采购的限制,但像 Qwen 3 这样既先进又开放 [ … ] 的模型无疑将被国内使用。它反映出企业既在自主开发工具 [ as well as ] 也在通过 Anthropic 和 OpenAI 等封闭模型公司购买现成产品的现实。”zaD喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
特斯拉与上汽讨论两轮FSD授权?官方回应

特斯拉与上汽讨论两轮FSD授权?官

11月1

11-19 94阅读
OPPO Reno 13 系列手机外观公布,代言人宋雨琦

OPPO Reno 13 系列手机外观公布,

11 月

11-19 112阅读
天玑9400性能之神!iQOO Neo10系列前瞻

天玑9400性能之神!iQOO Neo10系列

今天,iQOO

11-19 103阅读
“农药”不老,腾讯有“宝”

“农药”不老,腾讯有“宝”

腾讯

11-19 102阅读
1元水,巨头们的游戏

1元水,巨头们的游戏

今年

11-19 128阅读
太太太灵了吧,这是什么「好东西」

太太太灵了吧,这是什么「好

作者 / 西贝偏北运营 / 狮子座还记得

11-19 101阅读
让赵露思摇来肖战鹿晗打call的《珠帘玉幕》,好看不?|Talk剧评

让赵露思摇来肖战鹿晗打ca

作者 / 张   特编辑 / 阿   笔运

11-19 125阅读
长安十二时辰龙波是好是坏 龙波扮演者是谁资料作品介绍(长安十二时辰龙波是好是坏)

长安十二时辰龙波是好是坏

《长安十二时辰》这部剧正在热播,在

11-19 99阅读
《山河之影》是耽改吗?谢铿然最后是不是下线了?

《山河之影》是耽改吗?谢铿

电视剧《山河之影》是你根据同名

11-19 110阅读
时隔3年正式回归连更2条作品 李子柒:还有存货正在剪

时隔3年正式回归连更2条作

11月12日消息,时

11-19 90阅读
真人互动恋爱影游《欢迎光临!心动咖啡厅》Steam页面开放 发行日期待定

真人互动恋爱影游《欢迎光

今日(11月16日),真人互动恋爱影游《欢迎

11-19 116阅读
PS5 Pro在美国的首发销量与PS4 Pro相近

PS5 Pro在美国的首发销量

PS5 Pro 于本月早些时候发行,虽然这款

11-19 126阅读
TGA:DLC、拓展包、新赛季、重制版等均可提名所有奖项

TGA:DLC、拓展包、新赛季、

今日(11月16日),TGA主创Geoff Keighley与

11-19 117阅读
原神空幻回响的花神诞祭任务全流程一览

原神空幻回响的花神诞祭任

空幻回响的花神诞祭是须弥地区魔神主线

11-19 129阅读
饥荒所有魔杖制作方法详细介绍

饥荒所有魔杖制作方法详细

饥荒游戏里面拥有非常丰富的魔杖种类,不

11-19 112阅读