2026年,这行的大咖都聚一块儿聊了

说到具身智能这行当,大家都挺好奇到底啥时候能有个像“GPT-3”那样的大飞跃。就在2026年3月27日,也就是2026中关村论坛年会那会儿,有个专门讨论AI前沿的圆桌会,好多这行的大咖都聚一块儿聊了。银河通用的王鹤、智平方的张鹏、千寻智能的高阳,还有原力灵机的唐文斌、星动纪元的席悦都到场了,大家一块儿把未来的路给画了个大概。 大家伙儿都觉得,2025年主要还是打基础的时候,到了2026年,这技术才真正要从实验室里跑出来,变成能用的东西。千寻智能的高阳就说了,现在的行业大概还在“GPT-2”那个阶段,虽然数据基础建得不错了,但想搞出“GPT-3”那样的好东西,还得攻克好多技术难关。他估摸到2026年底或者2027年上半年,差不多就能看到像样的模型了。 唐文斌听了觉得有道理,他也说行业虽然现在还嫩,但潜力巨大,发展得很快。王鹤接着补充,2025年关键是要把共识找齐、场景打开,到时候竞争肯定会特别激烈。星动纪元的席悦也觉得2026年特别有意思,好多新公司会冒出来,行业洗牌也会加速。 虽然前景看着挺好,但是想走到“GPT-3”那步确实不容易。大家都觉得最大的拦路虎就是数据。席悦直接吐槽说,在真实环境里凑数据太难了,光有场景方的配合还不够,搞个大模型采集成本又高、效率又低。 唐文斌把问题说得更透彻:数据采集本身就是个“烧钱又费时间”的事儿。虽说砸钱能解决一时的问题,可更大的难关在于怎么让机器人在干活的时候一直反馈数据,形成像自动驾驶那样的“数据飞轮”。他打了个比方说现在有些不成熟的应用看着像是机器人在瞎跳,但在技术不那么好的时候也能给人带来点情感上的价值,好歹也是种值得试的商业模式。 除了数据这块难搞,模型架构也得升级。高阳提到现在的视觉-语言-动作(VLA)模型设计还太简单了,比如输入只能是一张图。他觉得以后的机器人得有像大语言模型那样的“记性”,怎么通过改架构让决策系统更一体,这又是个难题。 智平方的张鹏从整体系统的角度看问题,他说光靠谈模型或者数据不行,得把“模型、硬件和场景系统”这三个东西捏合到一起,在真家伙里多练练才行。 虽说具身智能还没彻底进咱们家的日子还没到,但在工厂或者公共服务这些地方已经开始落地了。几位专家也一致觉得工业和公共服务是最好的切入点。 高阳就说千寻智能主要盯着工业和服务这块儿看,因为这地方场景比较规矩或者半规矩的,花样不多好标准化复制。张鹏也表示半结构化的制造业还有简单的物流服务,是把模型能力和供应链能力结合起来做规模化交付的好地方。 唐文斌还列了四条挑场景的硬杠杠:得能接受出错、对效率有一定的容错度、还得有点泛化能力、最后还得算清楚长时间作业的投资回报率(ROI)。 技术在进步市场也在长大,这个行业正在大变活人呢。专家们的讨论也算是给大家指了条明路:以后的具身智能不再是实验室里的花架子了,得在真家伙里派上用场。2026年就是这行往上冲的关键年了,在座的每一个参与者都得为这个变革出把力。