硫酸钙地板厂家-AI 平头哥发布首款智能网卡「磐脉 920」，补齐算力最后一块短板

「通云哥」之模式虽前期投入大、周期长，但一旦走通，护城河也极深。

」过往几年，甚多公司做芯片，往往集中于单一环节，比如 GPU、AI 加速卡或者 CPU。

此种全栈自研之闭环，于国内科技公司里并不多见。

」李旭慧表示。

GPU 买之彼么多，跑起来却像「堵车」。

他观察到，目前行业里甚多万卡级智算集群，GPU 实际使用率较低，「能做到 60%，已算行业顶尖水平。

Horror。

除之性能本身，磐脉 920 背后更值得关注之，为平头哥与阿里之整体陈设。

好像只要卡够多，AI 就能续往前跑。

收到数据，搬过往，仅此而已。

过往行业更易关注「有多少卡」，但实际于 AI 操练场景中，体系运行效能并不为由最强之硬件决定，而为受限于集群里最慢之彼名节点。

李旭慧打之名比方：旧俗架构里，经常会现「四名下行通道挤一名上行通道」之情况。

」先有阿里云之大规模业务场景，再从实际场景需求里倒推货品定义。

结局就为，有之路径长，有之路径短，时延不一致。

同时，多路径本领可把互换机端口缓冲区水线降低 90%，减丢包与重传。

CSDN。

当 AI 智能体始进入确凿业务场景，推演业务之占比越来越高。

为何为阿里于定义 AI 根基设施。

FP。

「居先节点之算力会延续闲置等待，造成大规模算力费。

随之 AI 越来越多从操练走向推演，模型、云与芯片之间形成之延续回馈轮回，整体优势之显现或才刚刚始。

闻鸡起舞。

此也为追觅过往几年于海外商场一系列动作之意义所于。

旧俗效劳器架构里，PCIe Switch 通常部署于主板上，数据需绕多名节点转发。

东部率先发展。

算力提供动力，网力保障效能。

」你如何看待「磐脉 920」。

少绕路，意味之更低时延；路径更一统，则意味之更稳固之齐步效能。

4 月 28 日，于数术华夏建立峰会上，平头哥发布首款智能网卡磐脉 920。

老当益壮，宁移白首之心？

一张网卡，盘活整名智算集群李旭慧解释，磐脉 920 通过支逐包喷洒、乱序接收与选择性重传，实现 RDMA 多路径。

李旭慧告诉极客公园，磐脉 920 立项之时 AI 智能体尚未成为行业焦点。

西游记。

疑难不必出于算力本身，而或出于另一件长期被忽视之事情上——网力。

」从此名角度看，磐脉 920 之发布，本身就为阿里「通云哥」协同本领之一次体现。

大模型操练强调强齐步，而推演面对之为大量突发、小包、高频请求，对低时延与稳固性之要求更高，此也意味之对「网力」之要求更高。

让网络始从被动传输，变成主动调度。

第二名枢纽设计，为把「绕路」变成「直连」。

不少做大模型操练与推演之者，已越来越明显地感受到另一层疑难：机器越来越贵，GPU 越来越强，但模型操练与推演之效能，却没有齐步提升。

对应之，正好为数据中心里之几名枢纽环节：算力、存力与网力。

直白讲，就为它能主动避堵。

但彼等从阿里云自身业务中裁决，前景 AI 必会推动数据中心网络本领晋级。

模型需求推动云根基设施晋级，云场景又反向推动芯片演进。

按照官方实测，磐脉 920 支单 QP 打满 400G 带宽，而同类主流货品带宽大约只有其一半。

首先为支多路径 RDMA，打破单一路径之局限。

风萧萧兮易水寒，壮士一去兮不复还。

当地光阴4月13日，印尼国防部长夏夫里·夏姆苏丁访美，与美国防长赫格塞思于五角大楼举行会晤，两国宣布建立国防伙伴关系。

目前，平头哥已形成四条货品线：真武系列 AI 芯片、倚天效劳器 CPU、镇岳存储主控芯片，以及此次发布之磐脉系列智能网卡。

疑难于于，只要其中一部分节点慢下来，其他节点就只能等待。

磐脉 920 欲处置之就为「网力」疑难。

视频。

据透露，和头哥倚天、真武、镇岳系列芯片一样，它会先部署于阿里云数据中心。

此就为磐脉 920 之商业路径。

对于需高度齐步之 AI 操练差事来说，此种「不整齐」会直接影响效能。

从结局来看，此套预案带来之改善较量直接。

「一线业务场景之实际需求，为芯片技艺迭代与货品改良之核心驱动力。

甚多芯片公司做货品，先做出来，再去找主顾与落地场景。

根据平头哥实测，于相同集群规模与差事机缘下，部署磐脉 920 后，大模型操练与推演差事成光阴可缩短 14%。

旧俗网卡更多像搬运工。

通俗体谅，就为原本只能走一条高速，今变成多条路同时分流。

平头哥货品总监李旭慧打之名比方：「若把算力比作 AI 时代之石油，网力就为输油管道。

整顿。

最近两年，AI 行业最热之词始终绕不开「算力」。

其背后之实现原理，有三名枢纽。

而概括一下磐脉 920 于做之事，就为尽量减整体系里之「堵」与「等」，通过网力之提升来释放 AI 算力。

单张 GPU 性能再强，也须跟整名集群保齐步。

此也为国内首名做到此一点之 400G 智能网卡。

磐脉 920 最大之亮点之一，为内置 PCIe Switch。

磐脉 920 把 PCIe Switch 直接集结进芯片内部，让网卡与 CPU、GPU 形成更直接之连接关系。

更枢纽之为，此些数据虽分开走，但最终还能按顺序准确拼回来。

Civilization。

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO 此也为平头哥与甚多单点芯片公司之区别。

从大模型操练，到本年 Agent 之火热，再到各家云厂商不断扩建智算中心，行业讨论最多之，几乎皆为 GPU、芯片与算力规模。

通义负责模型，阿里云负责场景，平头哥负责底层硬件。

从此些设计能看出来，磐脉 920 并不为于追寻参数上之简提升，它做之事情甚务实，让已甚贵之算力，少费一点，从而激发最大之潜能。

」磐脉 920 之发布实际上也指明之一名方位：当 GPU 已足够强之后，下一步到底该补哪里。

今日之大模型操练，一名操练差事，往往需几千甚至上万张 GPU 同时协作。

AI 角逐走到今日，比拼之已不为单点本领，而为此一整套体系能否顺畅运转。

此为国内首名内置 PCIe Switch 之 400G 智能网卡，最大支 400Gbps 吞吐带宽，可应用于万卡智算集群、通算集群与高性能存储等场景，目前已量产，并将率先部署于阿里云数据中心。

据之解，磐脉 920 加入之细粒度网络感知与可编程拥塞控制本领。

此甚像四条支路同时汇入一条主干道，堵塞几乎不可免除。

「于 Agent 应用爆发之底色下，推演业务之增益速度显著快于操练。

第三名枢纽，为让网络具备自己裁决之本领。

李旭慧于采访中表示：「单一芯片货品无法处置全链路疑难，只有打通算力、存力、网力，才能最大化释放 AI 硬件性能。

它不为只做一块性能更强之芯片，而为试图从整名体系角度去看疑难。

秋。

但平头哥之思路为做全栈。

对于越来越繁之 AI 集群来说，此种本领之重要性会越来越明显。

上一篇：美财长称要求北京方面支美国于霍尔木兹之兵戎行动，邦交部回应 下一篇：采购禁入！科华数据材料造假被拒门外

AI 平头哥发布首款智能网卡「磐脉 920」，补齐 算力最后一块短板 - 巴甲

相关推荐

AI 平头哥发布首款智能网卡「磐脉 920」，补齐算力最后一块短板 - 巴甲