当前位置:文章 > 列表 > 正文

20万字不到1分钱,梁文锋把token价码打骨折之 - 阅后即焚

📅 2026-05-19 05:02:46 🏷️ 买伦敦金用什么交易平台 👁️ 663
20万字不到1分钱,梁文锋把token价码打骨折之

DeepSeek此次降之,不只为token之单价。

模型之性能跑分为它之上限,然则吾等只需吾等能用到之部分。

拼多多。

大模型API只为用来引流之,真正赚钱之为背后之计算、存储、数据库等云效劳。

” 更枢纽之为,若承认“吾等也要降价才能角逐”,就等于承认“吾等没有技艺护城河”。

若吾等按FP8精度来算,昇腾950PR为7万元/PFLOPS,英伟达H200为6.31万元/PFLOPS。

梁文锋曾于2024年表示:“吾等只为按照自己之步调来做事,然后核算本金定价。

演绎。

若DeepSeek长期只停留于模型层,它仍然会被卷入无休止之价码战。

华为昇腾、寒武纪、海光讯息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯8家国产AI芯片品牌于DeepSeek-V4发布当天就成之适配。

于首份财报中,智谱公开之自己之商业逻辑公式:AGI商业身价=智能上限×Token消耗规模。

此为因,大厂卖API之本原,为卖背后之一整套效劳。

Zabbix。

业内还没反应过来呢,结局4月26日晚间,DeepSeek就再次降价。

故即便DeepSeek为于赔本赚吆喝,也并不会让者感到极其意外。

低价可为入口,却不应成为终点。

尤其为大厂,彼等压根不于乎DeepSeek降价。

一旦此名锚点形成,其他厂商就陷入之两难。

飞镖

它先用价码打穿商场,再用开源建立性命,再用企业效劳、私有化部署、云厂商协作与应用货品去承接身价。

感受。

2月代码订阅套餐上调30%,3月旗舰API上调20%,4月8日再次上调10%,累计涨幅83%。

DeepSeek不能一辈子靠超低API价码活之。

上海译文出版之《挪威之林莽》,全书约20万字。

” 对于钱庄、政务、制造、动力此些行业来说,价码不为唯一疑难,数据安康可控才为核心疑难。

真正能提升商业化上限之,为应用层货品,比如agent与CLI。

此名场景之特征为,模型不用每次重新体谅全部上下文,大量重复输入可复用,压力主要集中于推演吞吐、显存/内存带宽、调度与缓存管上。

模型能不能稳固跑于昇腾上,推演框架能不能适配,算子有没有改良,掘发者迁移本金有多高,才决定之此条路为“能演示”,还为“能商业化”。

欧联杯

梁文锋不需DeepSeek有最强之性能。

对于智谱此名上市公司来说,算力为稀缺源泉。

切尔西队

跟价,赢利方位被压缩;不跟,就须向主顾解释“我贵于哪里”。

梁文锋可把开源模型作为入口,把企业级部署、调优、运维、安康、权限管、学识库接入变成真正之收费效劳。

故,电车之受众有尽,此为华夏车企甚难靠自己处置之疑难。

Blockchain Tech。

DeepSeek降价之本原为彼等找到之对应之主顾。

惊人涨幅

此名价码也为于本金之上稍微有点赢利。

枢纽点就于于,即便为主顾用DeepSeek,彼等依然离不开阿里云之算力与存储。

模型本领会被追击,API价码会续降,掘发者也会于不同模型之间切换。

并且,1张昇腾950PR之推演吞吐量约等于2.2-2.8张H20。

但若持高价,又须拿出足够有说服力之差异化身价。

梁文锋仍然需给DeepSeek找商业模式 叠加限时折扣后,V4-Pro之缓存输入低至0.025元/百万tokens, V4-Flash降至0.02元/百万tokens,创下全球大模型价码新低。

此就导致实际上昇腾预案或要比英伟达H20之预案节省60%到70%。

真正决定国产算力能不能吃下此波需求之,为软件性命。

彼么吾等若把单卡之性价比优势放到大规模集群部署里,结局又会如何呢。

单颗昇腾910C芯片之BF16性能仅为英伟达Blackwell单芯片之约三分之一,但通过超节点集群方式,单名CloudMatrix 384集群之BF16总性能反而为NVL72之1.7倍,总内存容量为后者3.6倍,总内存带宽为后者2.1倍。

苹果设备

此还只为算力之方面,考虑硬件本金,事情就会更有意思。

《给阿嬷之情书》会成为黑马,甚至五一档夺冠吗。

操练侧仍然更依赖高端GPU、成熟软件栈与大规模集群阅历DeepSeek真正走通之路径,或不为“一夜之间替代英伟达”,而为先于推演侧、缓存场景、长文本应用里,把国产算力之性价比优势释放出来。

Organism。

尤其为对于RAG学识库、智能客服、文档剖析等缓存命中率超过60%之应用场景,本金可直接降90%以上。

而且梁文锋也意识到一名疑难,彼就为AI就为根基设施,就与柴米油盐为一样之,彼么价码战就变得于所难免,最终,AI也会像云计算一样走向“规模货殖+薄利多销”。

先用限时折扣测试商场承受力与效劳器负载,紧接之对缓存命中此一高频场景实施永久性降价。

更枢纽之为,DeepSeek已适配华为昇腾性命。

廉可打开商场,但廉本身不为商业模式。

ai芯片

智谱之API年化进项(ARR)于过往12名月暴涨60倍至17亿元,Token调用量于价码上涨83%之底色下仍增益400%。

背水一战。

油价上涨此件事,或也没法像过往几次石油险境成就日系车彼样,彻底把华夏电车捧上神坛。

梁文锋于用DeepSeek之影响力,让商场形成一名新之认知:“若DeepSeek此名级别之模型已能做到此名价,别家为什么还要卖此么贵。

但月之暗面之K 2.6以及MiniMax即将发布之M3模型,性能皆要高于DeepSeek-V4-Pro。

DeepSeek此次降价,砍于之缓存命中之价码上。

生长。
足总杯

故此次价码降,还只为预告而已。

将整本书命中缓存后喂给DeepSeek-V4-Pro,彼么其总本金不到1分钱。

激光雷达

昇腾950PR之单卡功耗(600W)比H20(350W)高,但单位算力功耗低65%,相同算力下对电力与制冷之需求大幅降低,基建投入显著减。

DeepSeek之身价于于,它不为一家边缘模型厂商做适配,而为一名头部模型亲自把流量与需求带进国产算力性命。

昇腾950超节点通过集群预案弥补之单卡制程差距。

大年

吾等降价一方面为因吾等于探求下一代模型之架构中,本金先降下来之,另一方面也觉得无论API,还为AI,皆应为普惠之、者者可用得起之东西。

忠孝廉耻。

彼等于主顾大众上或会与DeepSeek有交集,但甚难形成全面抵触。

真正难受之为智谱、MiniMax与月之暗面此样之中间层。

乡村振兴。

月之暗面与MiniMax之特征为量大廉,当DeepSeek把API价码打到此么低,此两家或多或少皆会有些难堪。

华为

吾等之原则为不贴钱,也不赚取暴利。

尤其为大模型推演本身仍然消耗算力、电力、带宽与运维,价码越低,调用量越大,对根基设施之压力也越大。

DeepSeek研讨员陈德里于社交媒体上确认,输入缓存降价为永久性之,并打上之“AGI for Everyone”之标签。

运筹帷幄。

DeepSeek两天两降,此不为简之价码战。

深圳市

云厂商会增国产芯片之采购,芯片厂商会加大研发投入,掘发者会适配国产性命。

声波污染

与其通过价码战抢来大量低身价主顾,不如提升价码筛选出高身价主顾,把有尽之算力用于刀刃上。

故我始终认为,DeepSeek之低价API,应不为梁文锋心里所想之商业化解答,更像为一名入口。

彼么DeepSeek打折,也甚或带动一波国产AI芯片销量。

梁文锋又出手之,而且还为二连降价。

DeepSeek给国产AI芯片替代讲典故 梁文锋真正之杀招不于于“廉”,而于于“定价”。

更枢纽之为,若承认“吾等也要降价才能角逐”,就等于承认“吾等没有技艺护城河”。

Chain of Responsibility。

此才能把“底座”之身价最大化。

以阿里云为例,4月15日算力卡涨5%-34%、存储涨30%,但同时又愿意代理DeepSeek。

DeepSeek之宗旨,为成为华夏AI掘发者之“默认底座”。

当然,此并不意味之国产算力已全面替代英伟达。

调价后,GLM系列编程场景缓存命中Token单价已接近Claude Sonnet 4.6之水平。

换句话说,它不为最依赖“单卡操练峰值”之场景,而为更适合通过国产芯片集群、营造改良与规模化调度来摊薄本金之场景。

昇腾950PR毕竟为一张推演卡,若吾等按照推演专用之FP4精度来算,昇腾950PR为4.49万元/PFLOPS,英伟达B200为4.44万元/PFLOPS。

唐纳德·特朗普

” API进项只为第一层,模型标准、掘发者性命、企业部署、算力适配、云厂商协作,才为梁文锋欲之商业化方位。

元宇宙。

于A股,海光讯息以8.2%之增幅领涨、寒武纪增幅为2.23%,于港股,天数智芯之涨幅达到9.54%。

虽说国内所有AI公司,几乎皆为摸之DeepSeek过河,但DeepSeek此波降价之后,却并非所有者皆忧。

连DeepSeek皆始大规模用国产芯片,整名产业链就会被激活。

但若持高价,又须拿出足够有说服力之差异化身价。

只要足够多之应用与agent以DeepSeek作为基座模型掘发,彼么DeepSeek就掌握之入口。

于此名逻辑下,谁之本金架构更优、谁之技艺迭代更快、谁能更早实现规模效应,谁就能活到最后。

4月25日,DeepSeek-V4-Pro开启限时2.5折优惠,输入价码(缓存命中)降至0.25元/百万tokens。

全系API输入缓存命中价码直接降至首发价之1/10。

华为昇腾950PR之定价约7万元者民币,英伟达同级别H200约合者民币25万元。

DeepSeek官方透露,目前Pro版本之效劳吞吐受限于高端算力,预计下半年昇腾950超节点批量上市后,Pro之价码还将大幅下调。

Meteorology。

估值拉高以后,融之金额也就多之,同时梁文锋也需用商场、进项来证验DeepSeek达到估值所对应之高度。

API价码打到此名程度,短期内可制造影响力,吸引主顾,不过它甚难成为一家长期公司之全部进项来源。

华为官网

就像当年小米手机对智能手机商场之冲击一样,不为销量第一,但更张之所有者对“合理价码”之预期。

他认为,只有让AI真正普惠,才能激发出足够大之应用商场。

无论为企业主顾还为名者主顾,模型之性能与用体验之间有一道鸿沟。

DeepSeek更大之商业化机会,或于企业私有化部署。

近朱者赤,近墨者黑。

智谱AI于4名月里已连续三次涨价。

它们未必会长期用公共API,但会愿意为一套能部署于自己机房、自己云氛围里之模型体系付费。

于DeepSeek-V4发布当天,AI算力芯片板块股价大涨。

影响

摸之DeepSeek过河 而大模型之API价码,甚大程度上取决于硬件本金。

以100卡集群为例,国内常用之英伟达H20预案裸卡本金为1000万,13台效劳器主机286万,加上机柜等,总价约为不到1500万元。

智谱CEO张鹏之解释只有一句话:“瓶颈于算力,不于主顾。

只要有足够多之掘发者与企业知道“还有此么廉之选择”,整名行业之定价体系就会被重构。

也只有应用商场足够大,技艺迭代之飞轮才能真正转起来。

人无远虑,必有近忧。

根据英伟达AI于X上发布之讯息,DeepSeek之确可部署于英伟达Blackwell架构芯片上,不过此名本金更高,约为40万元者民币。

它为把“长文本、长代码、长学识库”此些原本最烧钱之AI应用场景,全皆打入之价码之谷底。

疑难不为主顾不愿意付钱,而为现有算力已接近满载,续低价只会让效劳品质降。

ipo

对于上市公司来说,API就为核心进项,压低API价码就等于降低毛利。

Techno-space。

同规模华为昇腾950PR之预案约为1000万出头。

上一篇:宁德时代钠电池年内将实现大规模量产 下一篇:佘诗曼为许绍雄女儿庆29岁生日!助她走出丧父悲痛!发文:你并不孤单