陈天桥：ai的进步大，可问题是这些模型真的智能吗？

大家总说AI模型进步大，可问题是这些模型真的智能吗？最近盛大集团的陈天桥指出，咱们现在用的模型更像“文科大模型”，擅长背答案写作文，但在现实世界里解决实际难题时，这点本事往往不够用。他举了个很现实的例子：哪怕一个模型做单项选择题时能答对98%，但如果要它连续进行300步的逻辑推理，最终成功的概率可能会暴跌到0.23%。这就好比让一个人在没有提示的情况下，连续走300步都不出错，这事儿太难了。为啥会这样？因为现在的模型大多用Transformer架构，这种结构只能处理概率性的预测，在面对那些数据模糊、没有标准答案的“开放域复杂问题”时，根本派不上用场。陈天桥觉得，真正的通用人工智能（AGI）应该像个工程师，遇到问题不是瞎猜，而是得把复杂的大问题一步步拆解成简单的小问题去解决。他提出了一个新的衡量标准：能不能在完成300步复杂推理后，依然保持99%以上的正确率。为了做到这一点，就得改变思路。陈天桥建议把AI的工作拆成两部分：一部分负责把大问题分解成小步骤（逻辑生成层），另一部分负责立刻验证这些步骤对不对（检验验证层）。这样一来，AI就需要有记忆力去记住每一步做了啥，还要有修正机制去纠错。像MiroMind搞的BrowseComp项目就实践了这个想法。他们用一个参数规模不大的小模型，搭配智能体（Agent）跟环境反复互动，结果在一些复杂任务上表现得比只知道一次性生成答案的大模型强多了。这种方法代表了一种新范式——“理科大模型”。它不再追求参数有多大、提示词多聪明，而是把重点放在能不能让每一步逻辑都“钉死”，能不能跟真实世界进行有效的交互验证上。这就意味着未来的AGI不光要会说话讲故事，更得是个靠谱的发现者和验证者。它的价值不在于生成了多少漂亮的文本，而在于能不能发现新知识、找到解决问题的新方案。陈天桥的这个标尺超越了单纯比参数多少、跑分高低的老路子，直接把AI的目标定在了帮人类解决重大现实难题上。他的观点提醒我们，人工智能要想真正强大起来，光靠算法和算力是不够的，还得有方法论的革新和工程体系的重构才行。这对咱们国家乃至全世界的人工智能发展都有重要意义。它告诉我们，要想赋能实体经济和科技创新，就得引导AI从优秀的“叙述者”转型成可靠的“发现者”和“验证者”，真正成为推动社会进步的力量。