2026年，这行的大咖都聚一块儿聊了

说到具身智能这行当，大家都挺好奇到底啥时候能有个像“GPT-3”那样的大飞跃。就在2026年3月27日，也就是2026中关村论坛年会那会儿，有个专门讨论AI前沿的圆桌会，好多这行的大咖都聚一块儿聊了。银河通用的王鹤、智平方的张鹏、千寻智能的高阳，还有原力灵机的唐文斌、星动纪元的席悦都到场了，大家一块儿把未来的路给画了个大概。大家伙儿都觉得，2025年主要还是打基础的时候，到了2026年，这技术才真正要从实验室里跑出来，变成能用的东西。千寻智能的高阳就说了，现在的行业大概还在“GPT-2”那个阶段，虽然数据基础建得不错了，但想搞出“GPT-3”那样的好东西，还得攻克好多技术难关。他估摸到2026年底或者2027年上半年，差不多就能看到像样的模型了。唐文斌听了觉得有道理，他也说行业虽然现在还嫩，但潜力巨大，发展得很快。王鹤接着补充，2025年关键是要把共识找齐、场景打开，到时候竞争肯定会特别激烈。星动纪元的席悦也觉得2026年特别有意思，好多新公司会冒出来，行业洗牌也会加速。虽然前景看着挺好，但是想走到“GPT-3”那步确实不容易。大家都觉得最大的拦路虎就是数据。席悦直接吐槽说，在真实环境里凑数据太难了，光有场景方的配合还不够，搞个大模型采集成本又高、效率又低。唐文斌把问题说得更透彻：数据采集本身就是个“烧钱又费时间”的事儿。虽说砸钱能解决一时的问题，可更大的难关在于怎么让机器人在干活的时候一直反馈数据，形成像自动驾驶那样的“数据飞轮”。他打了个比方说现在有些不成熟的应用看着像是机器人在瞎跳，但在技术不那么好的时候也能给人带来点情感上的价值，好歹也是种值得试的商业模式。除了数据这块难搞，模型架构也得升级。高阳提到现在的视觉-语言-动作（VLA）模型设计还太简单了，比如输入只能是一张图。他觉得以后的机器人得有像大语言模型那样的“记性”，怎么通过改架构让决策系统更一体，这又是个难题。智平方的张鹏从整体系统的角度看问题，他说光靠谈模型或者数据不行，得把“模型、硬件和场景系统”这三个东西捏合到一起，在真家伙里多练练才行。虽说具身智能还没彻底进咱们家的日子还没到，但在工厂或者公共服务这些地方已经开始落地了。几位专家也一致觉得工业和公共服务是最好的切入点。高阳就说千寻智能主要盯着工业和服务这块儿看，因为这地方场景比较规矩或者半规矩的，花样不多好标准化复制。张鹏也表示半结构化的制造业还有简单的物流服务，是把模型能力和供应链能力结合起来做规模化交付的好地方。唐文斌还列了四条挑场景的硬杠杠：得能接受出错、对效率有一定的容错度、还得有点泛化能力、最后还得算清楚长时间作业的投资回报率（ROI）。技术在进步市场也在长大，这个行业正在大变活人呢。专家们的讨论也算是给大家指了条明路：以后的具身智能不再是实验室里的花架子了，得在真家伙里派上用场。2026年就是这行往上冲的关键年了，在座的每一个参与者都得为这个变革出把力。