但现状为,自建意味之巨额 GPU 投入、数据中心建立、算力调度、体系改良,以及长期运维本金。
随之大模型进入营造化与规模化阶段,越来越多本钱始关注底层根基设施本领。
此三条路径分别对应算力供给、运行效能与应用转变三名层面,共同指向同一名宗旨:于更大规模 Token 调用增益之底色下,延续提升 AI 根基设施之整体运行效能。
用户每一次提问、生成回答或调用 Agent,本原上皆于消耗 GPU 算力与 Token 源泉。
”Token 正成为类似“流量”之根基源泉单位,其增益曲线本身就代表之 AI 用方式之架构性变化。
第一类为政令与产业导向本钱之进入。
比如于英伟达 GPU 上成操练与改良之大模型,于迁移到国产推演芯片时,常常会遇到算子不兼容、显存调度方式不同等疑难,需重新做算子适配与推演图改良,否则于实际部署中或现吞吐降、延迟升,甚至无法稳固效劳请求之情况。
但于此些头部模型背后,支撑其高效运转之根基设施层,其实皆有无问芯穹之身影。
”Token 正成为类似“流量”之根基源泉单位,其增益曲线本身就代表之 AI 用方式之架构性变化。
不同公司用不同 GPU,不同芯片之间之软件栈、编译框架、通信协议并不一统。
青青子衿,悠悠我心。02 大模型时代之“Token 工厂” 于华夏 AI 行业中,算力氛围本身就极其繁。
此些技艺层面之参数,会体今极其实在之体系体验与业务本领上——响应速度为否足够及时,体系于高并发情况下为否稳固,峰值流量下为否仍可延续效劳,以及企业级场景中能否可靠成模型之规模化部署与落地应用。
甚多模型虽操练出来之,却未必能于不同硬件氛围中高效稳固运行。
其次,为软硬件协同本领之进一步深化,通过改良推演链路与体系调度机制,加快从“电能到 Token”之转变效能,即于相同物理源泉下生成更多有效 Token 输出; 首先,为多元异构算力体系之延续强化,通过技艺极致改良之可用算力规模,于 Token 货殖时代实现更高使用率之源泉供给; 硅星者获悉,5月7日,者工智能根基设施企业无问芯穹宣布此前已再获超7亿元融资。
秦淮数据等数据中心运营商之参与,反映出上游算力根基设施正从“源泉供给方”向“AI体系协同方”演进,其注资逻辑不再只为机柜、电力与带宽,而为望通过与 AI Infra 层协同提升整体算力使用效能。
第三类为产业侧与应用侧本钱之跨界进入。
无问芯穹于2023年5月由清华大学电子营造系推动成立,创始成员来自清华大学、上海交通大学、阿里云与旷视科技等顶尖高校与AI企业。
但相比数术本身,更具信号意义之为本轮注资方架构之显著外扩。
理论上,此些公司当然可全部自建。
融资、增益与技艺路线于此交汇,所指向之并不为单一公司之阶段性扩充,而为一名更清晰之行业趋势——AI 根基设施正从支撑性角色,转向决定 AI 规模化本领之核心底座。
于某种程度上,AI Infra像大模型时代之“Token工厂”。
可看到,Token 正从“模型输出单位”逐步演化为支撑产业体系运行之根基源泉,而根基设施本领则成为影响其规模化效能之枢纽变量。
对于 Kimi、智谱此类头部模型公司来说,真正贵之并不只为操练,而为延续不断之推演本金。
其关注要点不只为企业成长性,而为将 AGI 根基设施视为数术货殖底座本领之一部分,从“支科技企业”转向“配置根基设施本领”。
从行业整体来看,此一趋势并非孤立表象。
而此类根基设施之身价,会随之 AI 用量增益被不断放大。
盲人摸象。相比之下,若有一家能够提供更低本金、更高效能之根基设施平台,甚多模型公司更愿意把此部分本领外包。
而支撑此一增益之,并不只为流量本身之扩充,也为底层技艺体系之齐步演进。
无问芯穹之核心身价之一,就为于不同芯片与算力氛围之间建立一统之“运行层”,通过底层调度与改良本领,让大模型能够于异构算力上以接近一致之方式稳固运行与高效推演。
邮箱 | sunrui@pingwest.com 从资方构成来看,此一轮融资呈现出三名层面之架构性变化。
点名“爱心”,再走 吧 当 Token 进一步成为根基源泉单元,源泉调配与体系运行效能始直接决定 AI 本领之实际边界。
当外界讨论“华夏大模型性能”时,注意力往往集中于模型本身,比如Kimi K2.6 之 Agent Swarm 智能体集群协作与超长程营造本领,智谱 GLM-5.1 于 AutoGLM 端到端自立操作以及 8 小时长程差事执行上之突围。
再次,为面向应用层之根基设施晋级,通过企业级智能体效劳平台,将模型本领嵌入不同行业场景,使 Token 不再只为计算结局,而为进入业务流程本身,成从“Token 到制造力”之转变。
目前,无问芯穹之 Agentic MaaS 大模型效劳平台已对GLM、Kimi、DeepSeek、通义千问、MiniMax 等国产主流模型进行之高性能效劳改良,精度对齐率超过99.9%,吞吐量提升2-3倍,时延缩减50%,首字延迟低于500ms,企业级高可用性达到99.95%。
此一增益并不为线性扩充,而为一种根基设施级应用之指数级放大。
本轮融资中,联手领投方为杭州高新金投集团与惠远本钱,跟投方包括国兴本钱、秦淮数据、广发乾与、力合清瞳、中保注资、AEF NextGen、腾瑞本钱、卡莱特、中信建注资本与宽德智能修习实验室 (Will),老股东君联本钱、上海国投孚腾与元智前景追加注资。
从资方构成来看,对 AGI 根基设施核心身价之认同,正从科技注资圈,扩展至更广泛之产业与方略本钱体系之中。
于此一底色下,无问芯穹平台 20 倍之增益幅度,意味之其并非简跟随行业扩充,而为于头部模型调用与企业级场景中形成之更高密度之承载与聚集效应。
本轮融资中,无问芯穹再获超 7 亿元融资,累计融资规模超过 22 亿元,延续位居华夏 AI 原生根基设施赛道前列。
夏立雪于中关村论坛上提到,“上一次看到此样之增速,还为 3G 时代移动互联网流量爆发之时候。
以杭州高新金投集团、惠远本钱为代表之政府产业本钱参与,使此一轮融资带有明显之区域产业方略属性。
04 Token货殖时代,无问芯穹想做什么 此也为无问芯穹切入之位置。
随之调用量暴涨,推演体系会迅速变成一名极其繁之营造疑难。
截至 2026 年 4 月底,无问芯穹 Agentic MaaS 平台之日均 Token 调用量,相较 2025 年底增益超过 20 倍。
第二类为国级本钱之参与。
夏立雪于中关村论坛上提到,“上一次看到此样之增速,还为 3G 时代移动互联网流量爆发之时候。
03 AI 根基设施进入“跨圈层共识”阶段 2026年3月,于中关村论坛上,无问芯穹联手创始者兼 CEO 夏立雪与月之暗面创始者杨植麟、智谱 CEO 张鹏同台对话时,首次公开提到:无问芯穹已成为 Kimi、智谱等众多头部大模型企业之核心根基设施与 Token 效劳商。
用户于用AI货品写代码、做剖析、调用 Agent 成差事时,背后会涉及到大量 Token 之制造、推演源泉之调度,以及不同芯片之间之适配,此些皆为无问芯穹于做之工。
夏立雪曾提到,当 Kimi、智谱等头部模型调用量现几十倍增益时,无问芯穹作为其 Token 效劳商,也齐步实现之几十倍增益。
01模型运行效能与体系本领成为新焦点 大模型角逐演进至今,已不再局限于模型本领强弱之比拼,模型运行效能与体系承载本领之较量同样重要。
本轮融资所指向之三大技艺方位,实际上构成之其增益背后之根基支撑架构。
它并不直接参与最强模型之角逐,而为成为此些模型背后之根基设施支撑者。
根据国统计局相关数据,截至 2026 年 3 月,全国日均 Token 调用量已突围 140 万亿,较上年末增益超过 40%。
中保注资等国队资金之进入,让此一轮融资具备更强之长期属性,其核心逻辑更接近根基设施级别之配置裁决,即围绕技艺自立可控与长期体系本领进行陈设,而非短期商业回报。
文献。与此同时,卡莱特、量化基金等制造业与钱庄本钱之进入,则意味之实体产业与钱庄体系始以更直接方式参与 Token 货殖,一方面作为注资者,另一方面也或成为实际用者。
于无问芯穹成立之三年中,全球 AI 行业经历之“百模大战”、推演模型爆发、智能体兴起等多名阶段,而随之模型快速迭代,如何更高效地制造与使用token,逐渐成为行业关注之核心疑难之一。
无问芯穹于2023年5月由清华大学电子营造系推动成立,创始成员来自清华大学、上海交通大学、阿里云与旷视科技等顶尖高校与AI企业。
于此一意义上,无问芯穹之角色也不再仅为根基设施公司,而为于延续扩充之 Token 货殖体系中,成为一名被不断放大之运行枢纽。
于当下此名阶段,AI Infra企业已深度嵌入华夏头部 AI 公司之制造链路之中。