我本来是想写一篇关于国产大模型融资热的文章。
但仔细看完最近一周发生的事,我发现了一个更重要的信号——
AI行业的底层逻辑,正在发生一次结构性迁移。
这不只是一家公司融资500亿那么简单,也不只是一家企业停止使用英伟达芯片那么直白。
这背后是一场关于"算力主权"的争夺战。
而中国,正在完成一次静默的换乘。
先说一个我最深的感受。
你知道DeepSeek创始人梁文锋有多讨厌VC吗?
据雷峰网报道,这位幻方量化出身的程序员创业者,过去两年对所有找上门来的投资人说过同一句话——"VC的钱是负担"。腾讯来谈过,阿里来谈过,市面几乎每一家顶级风投都在他的闭门羹列表里。
他不是装的。梁文锋自己有一笔规模20到30亿的基金,是他自己的钱。他曾对外表示自己手里有四五万张卡,40、50亿是拿得出来的,不需要外部机构掏钱。
但就是这样一个"不差钱"的人,在2026年4月24日发布DeepSeek V4之后一个月,突然启动了DeepSeek有史以来第一轮外部融资——500亿人民币。
我仔细想了想,这个反转说明什么?
说明梁文锋看到了一个比"省着花"更重要的目标——规模化。
DeepSeek V4的发布是一个分水岭。万亿参数MoE架构,MIT协议全量开源,最关键的是——从训练到推理全流程跑在华为昇腾上,不再依赖Nvidia芯片。
英伟达CEO黄仁勋有一句评价非常直接:"一旦 DeepSeek 率先在华为平台上发布,对美国而言将是灾难性的结果。"
V4之前,市场看DeepSeek,是一家效率极高的模型公司——训练成本低,模型能力强,开源生态有影响力。
V4之后,市场看DeepSeek,是一家国产AI基础设施里最关键的模型节点——它率先走通了"国产算力+大模型"的完整路径。
所以那500亿融资,不是救命钱。
它是DeepSeek的定价锚。
梁文锋自己出了200亿,国家大基金领投。你不投,别人会投。估值从一个月前的100亿美元直接拉到450亿美元。这不是融资,这是重新定义这家公司在国家AI基础设施版图中的位置。
就在DeepSeek融资的同时,大洋彼岸也发生了一件大事。
2026年5月5日,Anthropic承诺在未来五年内向Google Cloud支付约2000亿美元,用于获取5吉瓦的TPU算力和云服务。
2000亿美元是什么概念?
你把它换算成现金,能买下整整两个英特尔。
Anthropic为什么要这么做?
答案就两个字:成本。
英伟达卖一张卡,毛利能达到惊人的70%以上。云厂商买完卡,还要再加价租给AI公司。谷歌的做法是"自研芯片+博通定制→自建数据中心→直接提供算力服务",这个"农场直达餐桌"的供应链,让谷歌可以把英伟达赚走的那部分超额利润,直接变成给Anthropic的巨额折扣。
据内部人士透露,谷歌提供的算力单价比英伟达方案低了整整40%-50%。
换句话说,Anthropic不是在"站队",而是在算一笔小学数学题——同样的效果,一半的价格,你用不用?
但这件事的意义远不止省钱这么简单。
这是顶级AI公司第一次大规模、长周期地抛弃了英伟达的通用算力,转而投向自研芯片。
芯片投资人王月评价说,这是"去英伟达化"进程中一个教科书级的里程碑。
一边是中国走通华为昇腾路线,一边是美国顶级AI公司从英伟达叛逃。两条看似相反的路径,指向同一个终点——算力正在从"通用商品"变成"定制基础设施"。
5月7日,无问芯穹宣布再获超7亿元融资。
这家公司的CEO夏立雪说了一句话,我觉得道破了这个时代最核心的变化:
"在Token经济时代,AGI基础设施扮演的角色,如同石化产业链中的炼化厂,它把能源转化为数字石油(Token),为各类AI终端应用和服务输出基础资源。"
Token经济。这是今天AI行业最被低估的新共识。
我上次听到类似的类比还是云计算刚兴起时,有人把数据中心比作电厂。现在无问芯穹把AGI基础设施比作炼化厂,把Token比作数字石油——这个类比更精准,因为它画出了上下游:
能源 → 算力 → Token → 生产力
无问芯穹发布了一个AI生产力公式:
AI生产力 = 智能规模 × Token生产效率 × Token价值转化
这个公式的厉害之处在于,它让"AI能力"第一次可以被量化、被比较、被优化——就像当年摩尔定律定义了芯片产业一样。
顺着这个逻辑往下想,你会发现:DeepSeek融500亿是在抢炼化厂土地,Anthropic花2000亿锁定谷歌TPU是在签长期原油供应合同。他们在做同一件事——抢占Token经济时代的核心基础设施。
讲了这么多宏观叙事,让我们聊一个普通人也能感同身受的场景。
2026年4月22日,特斯拉第一季度财报电话会议上,马斯克承认了一个让400万特斯拉HW3车主心碎的事实:
"HW3确实没有能力实现无监督全自动驾驶,它的内存带宽只有HW4的八分之一。"
等等,我记得2019年他说的是"无需新硬件,现有车辆OTA升级就能实现L5"。
从2015年"两年内实现完全自动驾驶",到2019年"2020年底你们就能在车里睡觉",到2021年"年底推出无监督版",到2022-2024年一次次跳票——11年,10多次公开承诺。
然后,在2026年,所有HW3车主被告知:你花的8000到15000美元买的FSD软件包,你的车一辈子都用不上。
这不是软件没写好。这是硬件底层的物理缺陷。
HW3采用14nm工艺,算力144 TOPS;HW4是7nm工艺,算力720 TOPS。这道鸿沟,不是靠写代码能填平的。
这个案例之所以重要,是因为它揭示了一个AI行业的残酷真相——
在Token经济的底层,硬件就是你的天花板。 软件再优秀,也不能在一条14nm的跑道上跑出7nm的速度。
回到最初的问题:AI行业的底层逻辑正在发生什么样的迁移?
我把过去一个月发生的这些事放在一起,看到的其实是一个清晰的三角结构:
第一条路径:自研芯片 + 绑定大客户
代表:谷歌+Anthropic。用自己的芯片,签自己的客户,绕开英伟达。这条路径适合有生态能力的巨头。
第二条路径:国产算力 + 开源生态
代表:DeepSeek+华为昇腾。用国产芯片跑通全链路,开源换取生态。这条路径适合有战略耐心的优秀团队。
第三条路径:多元异构 + 中立平台
代表:无问芯穹。不站队任何一个芯片厂商,专注做"算力炼化厂",把不同芯片的算力统一管理、统一输出。这条路径适合做基础设施的中间层玩家。
三条路径,三个不同层面的玩家,都在做同一件事——降低对单一芯片的依赖。
10年前,大家谈"去IOE"(去掉IBM/Oracle/EMC)。今天,AI行业在谈"去英伟达化"。底层的商业逻辑是一样的——没有企业愿意把自己的命脉交到一家供应商手里。
回到梁文锋。如果让我用一个词形容DeepSeek的500亿,我会说:换乘。
就像高铁从一条轨道变到另一条轨道。在变轨的瞬间,车速必须降下来,车厢会晃动,乘客会不安。但一旦换轨成功,你会发现眼前是一条全新的、更长的、更快的跑道。
中国AI正在做的,就是这样一次静默的换乘。
从"用别人的芯片做最快的模型",换到"用自己的芯片做自己的生态"。
从"小而美的技术黑马",换到"国家级的AI基础设施"。
从"看融资额比的资本游戏",换到"看Token产能的生产力竞赛"。
换乘需要代价。500亿是一个代价。梁文锋自己出200亿,就是他在用自己的钱为这场换乘投票。
而换乘的终点,不是谁的模型参数最大,不是谁的融资额最高。是谁能以最低的成本、最高的效率、最大的规模,把算力转化成Token,再把Token转化成真正的生产力。
这才是AI商业的终极问题。
而这个问题的答案,正在以我们肉眼可见的速度,从硅谷的谈判桌上,移到上海张江、北京中关村、深圳南山的一间间办公室里。