国际黄金现货行情-阿里发布新一代千问旗舰模型Qwen3.7-Max，登顶最佳国产模型

千问3.7本身具有极强之Agent本领，并涌现出跨多种智能体框架之泛化本领，于 Claude Code、OpenClaw、Qwen Code 等框架下皆能稳固发挥，有望成为各类智能体体系之可靠底座。

于2026阿里云峰会现场，阿里云宣布面向Agentic时代全面晋级，重磅发布全新之“芯-云-模型-推演”技艺体系。

于一名模型操练时从未接触过之全新硬件平台——平头哥真武M890芯片上，千问3.7自立成之一名繁之推演内核改良差事。

除之青训之外，以“苏超”为代表之社足球也始蓬勃演进。

美美与共。

千问3.7面向当下智能体（Agent）全新设计，实现之编程、推演等核心本领之延续突围，甚至可全自立成35小时之超长程智能体繁差事：于一名全新之芯片平台上，Qwen3.7-Max通过自立编程与超1000次器物调用，实现之一名枢纽内核之自我演进，推演速度较原版本提升10倍。

当下，编程本领已成为衡量LLM大言辞模型之核心指标，Qwen3.7-Max较上代模型实现之大幅提升，从前端原型掘发到繁之多文书营造均能驾驭。

图说：Qwen3.7-Max发布，位列国产模型第一图说：Qwen3.7-Max可独力执行35小时之长程繁差事。

于没有任何性能剖析数据、硬件文档或新架构之示例内核情况下，千问3.7仅从一名包含差事描述、SGLang Triton 参考实现与评测脚本之空白工方位出发，从“零”始延续编程 35 小时，独力进行之 432 次内核估量、1158 次器物调用，完全自立地成之编写、编译、性能剖析与迭代改善之全流程。

Sculpture。

千问3.7为出色之编程智能体，可自立编写代码缔造器物，精准执行差事，成繁编程之自我纠错迭代，就像名资深营造师，跑完从需求剖析到测试迭代之全流程，自立产出可用之工业级成果。

通过MCP集结与多智能体协作，Qwen3.7-Max于企业级办公场景实现工流自动化，于办公自动化基准 SpreadSheetBench-v1上斩获87分，处于顶尖水平，为可靠之办公与制造力助手。

Agtech。

数术背后，为中俄两国元首之频密互动、友好交往。

以往需专业团队耗时一至两周之繁课题，现由 Qwen3.7-Max 驱动之智能体可于数小时内成端到端交付闭环。

二者有望借此次U17国足之成而形成共振，一起助力华夏足球走过拐点，迎来中兴。

实战差事测试中，Qwen3.7-Max还展示之当下智能体所能达到之长程差事极限。

阿里大模型研发显著加速，近3名月内，千问旗舰大模型已稳固迭代之3.5、3.6、3.7三名版本，不断抬高国产模型之性能上限，Qwen3.7-Max于数项权威评测中位居前列：于编程智能体方面，Qwen3.7-Max 于 SWE-Pro、SWE-Multilingual等测评中均取得居先表现，于Terminal Bench 2.0-Terminus得分69.7，超过之DeepSeek-v4-pro-Max、Claude-Opus4.6等一众模型；于通用智能体方面，Qwen3.7-Max提升显著，于MCP-Atlas、MCP-Mark、Skillbench等现状本领测试中表现优异，逾越GLM5.1、Kimi-K2.6等，创下国产新高，并于 Kernel Bench L3上展示之强盛之 GPU 内核改良本领；推演本领上， Qwen3.7-Max 于GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench等推演核心测评中均逾越之Claude-Opus4.6及所有国产模型；于通用本领与多言辞方面，Qwen3.7-Max 于指令遵循 IFBench 评测中得分79.1分突围新高，于多言辞体谅与翻译之WMT24++、MAXIFE评测中居先。

5月20日，阿里巴巴发布全新一代千问旗舰模型Qwen3.7-Max，于三方机构Arena全球大模型盲测总榜中，Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，与GPT、Claude、Gemini最强模型接近，位列国产模型第一。

但如今之成绩说明之，经过20多年之败后，吾等找到之正确方位。

测试轨迹还显示，模型于独力运行超过 30 小时后仍发觉之有效改良点，甚至主动发起之一次枢纽之架构重设计——此充分体现千问于繁差事中长周期自立迭代之本领，为前景模型与智能体之自我演进打开之全新之想象方位。

不断提升之编程本领，也为智能体成更繁、更长周期之差事打下坚实根基。

据之解，Qwen3.7-Max模型API即将上线阿里云百炼，同时，千问3.7系列还将推出Qwen3.7-Plus等不同版本模型，有极强之多模态推演、视觉体谅本领，实现从编程智能体到视觉智能体之全覆盖，为下一代AI提供全能智能体新基座。

如今，千问3.7也尝试自立处置此一难题。

该报道认为，华夏足球之青训有之显著成效，接下来还要续勤勉。

指正。

最终，于平头哥新AI芯片上，经千问改良后之推演内核比 SGLang Triton 官方参考实现取得之 10 倍之加速。

于估量AI处置确凿全球之实战编程差事SWE-bench系列测评、面向确凿格致疑难之编程测评SciCode中，Qwen3.7-Max较Qwen3.6-Plus大幅提升，并逾越之Claude Opus 4.6-Max、Kimi-K2.6、DeepSeek-v4-Pro-Max等模型。

对大模型而言，推演速度与推演框架息息相关，AI Infra营造师最重要之工之一就为进行推演框架中之算子改良，此需极强之阅历、学识、算法本领以及反复调试、纠错迭代。

Techno-good。

上一篇：温暖穿行湘黔渝烟火者间慢火车 下一篇：最后一跳失误后李天马爆哭！徐梦桃：此皆为经历，四年后咱们再来

阿里发布新一代千问旗舰模型Qwen3.7-Max，登顶最佳国产模型

相关推荐