大晓机器人这次开源了开悟世界模型3.0,名字叫Kairos 3.0-4B,大家给它起了个外号叫“原生大脑”,专门让机器人干活。它最大的本事就是能把理解、生成和预测这三个步骤打通,做成一个整体。以前的模型很多都是改改现成的大模型,不怎么懂物理世界,现在Kairos 3.0-4B从最底层重新设计,不光有机器人自己的运动数据,还有人类的动作和思维逻辑,这就把各种数据打通了,让模型真正知道事情的原理。它直接把命令发给Jetson Thor T5000这样的端侧平台去执行,不用中间转译,算力能跑到517 TFLOPS。 这次开悟3.0-4B在倒水、叠平衡石这些需要懂物理的活儿上特别厉害。倒水的时候水流得稳当当的,量也正好;叠石头的时候石头不会掉下来也不会变软。对比一下像Cosmos 2.5和Lingbot这些竞争对手,它们经常会出现不符合常识的情况,这就看出开悟3.0-4B的技术有多硬。 这个模型还特别会处理长时间的交互。它利用Agent技术把复杂的指令拆分成小块,再通过预测和自我反思来保证动作连贯。比如在7分钟长的家庭服务视频里,机器人能一口气完成整理桌子、洗衣服、做早饭这些任务,中间不停顿。这说明它在家庭服务或者工业制造这些地方都有很大的用处。 以前大家觉得模型参数越大性能越好,但开悟3.0-4B只用了40亿个参数就占用23.5GB显存,比同类产品小多了。在英伟达A800 GPU的Benchmark测试里,它的速度比Cosmos 2.5快72倍。要是生成10秒长的视频,它只要9.5秒就能完成;比Lingbot还要快151倍。现在它还能在云端做到1:1的实时生成,不光能上英伟达的GPU,连沐曦的也能适配。 最厉害的是它还能适应各种机器人的形态。不管是单臂、双臂还是灵巧手,只要是主流的硬件比如智元-精灵G1或者宇树G1,它都能一键生成相应的策略来干活。不用专门给每种机器人重新训练了。