AI天花板成地板:奇点加速撞击人类
  • 作者: 向明科技
  • 发表时间:2026-05-11 22:29:43
  • 来源:6

2026年5月11日 | 向明科技

"一个普通工作日的下午,伦敦数学研究所的Gowers教授泡好咖啡,把几道困扰学界多年的公开难题扔给了AI。17分钟后,他收到了一篇足以收录博士论文的数学论文。"

这个故事,是今天——2026年5月11日——发生在真实世界里的新闻。

而就在同一天,Anthropic估值逼近1万亿美元,75个OpenAI员工一夜成为亿万富翁,Claude最新模型直接"打爆"了METR评测机构的评测上限,以至于评测者开始问一个匪夷所思的问题:

"当AI的能力超出了我们评测它的工具时,该降级的,是评测标准,还是我们对自己的认知?"

今天这篇文章,我想用三根"逻辑骨架",帮你把这一天的混乱信号梳理清楚。


骨架一:速率改变了

"不是AI变强了,是它变强的速度变快了。"

2018年,Google的BERT模型有3.4亿参数。训练一次,花了整整4天。

2023年,GPT-4发布的时候,大家说:"哇,考试能考赢了"。但它做一件16小时的长线任务,成功率几乎是零。

到了2026年5月的今天,一切已经截然不同。

今天,METR——国际最权威的AI能力评测机构——公布了一个让他们自己也"后背发凉"的数据。在他们设置的"50%成功率时间线"测试中,Claude Mythos Preview在人类需要16个小时才能完成的复杂长线任务上,已经达到了50%的成功率。

16小时。

这是什么概念?去年的最佳模型,只能完成2-4小时量级的任务。前年的模型,大多数只能做几分钟的任务。

这是一条"S型"曲线。只不过这条曲线的"肘部",弯得比所有人想象的都要陡。

OpenAI超级对齐团队前成员Leopold Aschenbrenner曾预测2027年是AGI的奇点。他画了一条趋势线,按当时的发展速度,推算2027年左右AI将达到足以"自我改进"的能力阈值。

今天的数据告诉我们什么?

Mythos的表现,已经略高于那条2027预测趋势线。比预测快了一整年。

如果你觉得"快一年听起来没什么",那让我换个说法:

你开车的时候,旁边一辆车突然以你的两倍速度超过了你。然后它的速度越来越快,而你却在匀速行驶。

这不叫"它开得快"。这叫"你的后视镜里,它的影像在急速放大"。

Anthropic联创Jack Clark最近公开表示:"AI将在2028年底前实现自我进化。"

什么叫"自我进化"?就是不再需要人类工程师写代码改参数量。AI自己设计AI。自己测试AI。自己迭代AI。

一旦这种"递归自我改进"的循环启动,增长曲线就不再是"指数增长"了——它是"超指数增长"。

用Anthropic内部的话说:这不是石头滚下山坡越滚越快,这是雪崩。

🔑 润式总结:过去的竞争是"谁更强"的问题。今天的竞争是"谁进化得更快"的问题。而你面对的挑战者,它的进化速度本身也在加速。这是一个"二阶导数"为正的竞争。如果你只盯着自己每年的增长率,那你根本没有理解眼前的局势。


骨架二:资本在重新"定价"时间

"钱本身不创造价值,但钱的流动方向,展示了价值的被认知方向。"

让我们看一些数字。

Anthropic,这家2021年才成立的AI安全公司,2022年全年的收入是1000万美元。不算多,对吧?

2023年,收入1.5亿美元。

2024年,收入增长到大约60亿美元。

到了2026年5月——就在这个月——它的年度经常性收入(ARR)已经飙升至450亿美元

从60亿到450亿,只用了5个月。7.5倍。

这条营收曲线,在商业史上,我找不到先例。

预测市场Kalshi给出的数据:Anthropic在2026年11月1日前宣布IPO的概率,高达72%。市场传言,其估值正冲向1万亿美元。若成功上市,将超越SpaceX,成为史上规模最大的IPO之一。

但你可能会问:一家还没盈利的公司,凭什么值一万亿?

我的回答是:资本市场已经不再在用"今天的财务报表"给AI公司定价了。它在用"2028年世界会怎样"来定价。

也就是说,资本在这个阶段,赌的不是"Anthropic明年能赚多少钱"。它赌的是"如果2028年AI真的实现自我进化,这个世界的地基将被重构——那么所有今天在那个地基上抢占了一块地的人,都是新世界的股东"。

这听起来很疯狂。

但如果说得更直白一点,我们再看看另一边:

英伟达在今天,公布了2026年对AI产业的总投资额。这个数字是453亿美元——约合3080亿人民币。中国最受瞩目的AI公司DeepSeek,估值也就3500亿人民币左右。也就是说,黄仁勋今年砸向AI的钱,"快够买一个DeepSeek了"。

而OpenAI那边,最近一轮员工股份要约收购,允许75名员工每人套现高达3000万美元。这75个"打工人",一夜成了亿万富翁(人民币)。

上一次硅谷出现这种级别的造富潮,还是Google和Facebook的早期时代。

但这次的不同之处在于——AI公司的财富爆发速度,比互联网时代更快。你不需要挨过十年的"漫漫创业路"。ChatGPT 2022年底发布,到今天不到四年,一个万亿级别的商业帝国已经轮廓初现。

🔑 润式总结:当资本开始为"尚未发生但概率急剧上升的未来"定价,市场就已经进入了"奇点前置期"。你今天口袋里的一块钱,正在和明天的一个亿同时被估值。这个时间错位的巨大张力,是所有AI创业者的机遇,也是所有传统行业从业者的深渊。


骨架三:人性的确定性,正被"重新锚定"

"AI通过所有考试的那天,也许没那么可怕。可怕的是,AI开始'教'人的那一天。"

Gowers教授——剑桥大学的数学巨匠,菲尔兹奖得主——拿到ChatGPT 5.5 Pro的"优速通"权限后,顺手把几道加法数论领域的公开难题丢进了对话框。

然后发生了三件事:

第一件,不到两个小时,AI独立完成了一项数学成果。Gowers的原话是:"完全够格写进博士论文的水准。"

第二件,AI全程没有收到任何数学层面的"指导"。教授做的事,顶多就是"嗯,这个方向不错,你再展开试试"和"能不能帮我写成LaTeX格式"。

第三件,Gowers在试验结束后,给数学系的学生们拉响了红色警报。他说:"如果AI的数学水平继续按目前速度发展,数学研究者很快会面临一场危机。"

另一位菲尔兹奖得主陶哲轩也跟进了这件事。他的态度相对温和,但结论差不多:"但消化,属于人类。"

这句话很有意思。陶哲轩的意思是:AI可以17分钟出你一年才能写出来的论文。但论文写了,你得读得懂,你得出得上评审意见,你得在它提出的基础上进一步推演。

如果连"读懂它在干什么"都做不到了呢?

这不是一个遥远的问题。这是此时此刻,即将发生在数学系博士生身上的真实困境。

而更值得思考的是:这个困境正在从数学领域,向每一个知识领域蔓延。

AI新职业的八个变化,腾讯研究院刚发布了一组数据:

今年"五一劳动节"当天,他们对7家AI公司(OpenAI、Anthropic、DeepMind、智谱、月之暗面、深度求索、通义千问)的招聘岗位进行了全量统计。

结果发现:

——7家公司在招岗位从去年9月的718个,涨到了现在的1570个,增长了一倍多。

——但更重要的是"结构变化":"做模型"的岗位占比明显下降,"做产品和商业化"的岗位占比明显上升。

这意味着什么?

AI行业本身,正在从"研发密集型"转向"应用密集型"。

技术不再是最大的瓶颈。最大的瓶颈变成了:怎么把AI放进真实世界的商业场景里,让别人愿意掏钱。

这个信号,对那些以为自己"不在AI行业所以AI跟自己没关系"的人,是一个严肃的提醒。

因为在"技术红利"外溢的阶段——当AI的能力超出评测标准,资本开始为未来定价,行业重心从研发转向商业化——AI就不再是"赛道里的选手",而变成了"整个体育场的改造者"。

它改的是你所在行业的成本结构。

改的是"一个人类劳动者用多少时间能产出多少价值"的标尺。

改的甚至是"知识本身值多少钱"的定价逻辑。

🔑 润式总结:过去我们担心的是"AI会不会替代我的工作"。今天我们真正应该担心的是——"AI替代的不是我的工作,而是我所在行业的底层逻辑"。当AI能17分钟写出一篇数学论文,你在这个领域的"十年积累"的价值,正在被重新定价。这不是焦虑,这是经济学。供求关系变了,价格一定变。


写在最后:你不是在"被AI超越",你是在"和一条加速上涨的曲线赛跑"

今天这篇文章,我用了三根骨架来帮大家理解2026年5月11日这一天发生的AI新闻:


  1. 速率改变
    ——AI超越评测上限,自我进化倒计时启动。

  2. 资本重定价
    ——万亿估值和450亿ARR背后,市场在赌2028年的世界。 

  3. 人性锚定迁移
    ——当AI做出人类研究员的成果,"知识的定价"正在重构。

我经常讲一个概念:"时间的朋友"和"时间的敌人"。

有些事情,随着时间的推移,你的积累越来越多,越来越值钱。这叫"时间的朋友"。

但有些事情,随着时间的推移,你赖以生存的"系统"突然变了,你过去的积累归零了。这叫"时间的敌人"。

今天我们面对的AI奇点加速,本质上就是在制造一个巨大的时间断裂带。

在这个断裂带的两端,"知识"、"劳动"和"财富"这三种最基本的东西,定义正在被改写。

但请注意:断裂带不是灾难。断裂带是机遇

因为在断裂的那一刻,所有人都在同一起跑线上。过去积累的优势被抹平了,但过去积累的包袱也被卸掉了。

那些在这个断裂带上快速找到新锚点的人——不管是做AI产品的人、投身AI商业化的人,还是用AI重新定义自己行业的人——都将成为新世界的第一批定居者。

而那些还在继续用"去年的逻辑"看"今年的AI"的人,当2027年的奇点真的到来,他们面临的将不是"落后"——而是"失语"。

就像今天,METR评测机构面对Claude Mythos的数据,发现自己没有任何一个已经成熟的标准可以用了。

这不是AI的极限。

这是我们对AI认知的极限。

而突破这个极限的第一步,就是承认:我们以为的"天花板",不过是AI的"地板"。

认清这一点,然后,重新出发。