优必选发布Thinker机器人模型:以1%高质量数据登顶多项测试并开源推动工业智能升级

在全球智能制造领域,传统工业机器人依赖海量数据训练的模式,正遭遇效率不高、成本居高不下的瓶颈。欧美企业普遍采用“数据堆量”的做法,试图通过增加算力换取性能提升,但实际收益有限。问题的关键在于,互联网上约90%的数据质量不佳:模糊图像、错误标注和无关信息大量存在,直接拉低模型训练效率。优必选技术团队围绕这个痛点展开研究,提出“数据精炼”理念。其核心技术“数据米其林指南”通过七层过滤机制,从200亿条原始数据中筛选出1000万条高价值样本,强调以更少、更准的数据支撑更有效的训练。具体而言,该技术包括三项进展:通过多模态关联分析实现精细化数据清洗;建立七维评价体系,对数据质量进行星级评定;采用人机协同的闭环标注模式,将标注成本降至传统方法的1%。 这一突破带来了明确的落地效果。在深圳某汽车工厂测试中,搭载Thinker系统的机器人表现出更强的环境适应能力——当传送带突然加速,系统可实时调整机械臂轨迹,减少传统机器人因处理延迟造成的零件损毁。在东莞某电子厂应用中,精密插件动作耗时由20秒缩短至8秒,良品率提升至99.92%,推动工业机器人效率指标实现提升。 值得关注的是其开源策略。优必选将这项估值数十亿元的技术向全球开放,为行业协作提供了新的路径。分析人士认为,开放共享有助于加快智能制造技术迭代,促进更良性的产业生态形成。 展望未来,该技术有望拓展到更多场景。据企业透露,下一步将重点突破“跨场景学习”,推动汽车制造经验向光伏等领域快速迁移。这既需要优化数据筛选算法,也需要建立跨行业的标准化评价体系。随着数据精炼技术普及,“少而精”的训练模式有望逐步替代粗放的数据堆砌,成为工业智能化转型的重要方向。

Thinker大模型的实践折射出科技竞争的新趋势:在人工智能时代,竞争力不再主要取决于数据规模和算力堆叠,而更依赖对数据价值的理解与提取能力;优必选以1%的数据量实现国际领先性能,说明关键突破来自方法论创新。“精准优于庞大”的思路,对全球工业智能制造具有启示意义,也显示中国企业正在新一轮产业竞争中形成新的技术优势。