阿里巴巴发布闭源模型 Qwen3.7-Max,加大强化学习算力投入

阿里巴巴通义千问团队于 5 月 20 日发布闭源旗舰模型 Qwen3.7-Max,在 Artificial Analysis 智能指数上得分 56.6,并在代码、数学及 Agent 任务等多项基准测试中位居中国模型第一。在推理挑战性基准 CritPt 上,Qwen3.7-Max 的得分较上一代提升近 4 倍,同时超越 Gemini 3.5 Flash 及 Claude Opus 4.6/4.7;GPQA Diamond 得分 92.3%,SWE-bench Verified 编程得分 80.4,HMMT 2026 数学得分 97.1%。模型支持 100 万 token 上下文窗口,经测试可连续运行 35 小时、完成逾 1,100 次工具调用,定位企业级长链 Agent 场景。

通义千问团队成员程楚杰在 X 上表示,此次 Qwen3.7-Max 在强化学习(RL)训练阶段投入的算力"远超以往任何一次",并称这只是 RL 规模化路线的起点,后续将继续推进。模型目前通过阿里云百炼平台 API 提供访问,暂不开源。此次发布亦配合阿里巴巴自研 AI 芯片珍武 M890(Zhenwu M890)一同亮相,该芯片显存 144 GB,芯片间互联带宽 800 GB/s。

X @teortaxestex | X @ChujieZheng