优必选发布Thinker机器人模型：以1%高质量数据登顶多项测试并开源推动工业智能升级

在全球智能制造领域，传统工业机器人依赖海量数据训练的模式，正遭遇效率不高、成本居高不下的瓶颈。欧美企业普遍采用“数据堆量”的做法，试图通过增加算力换取性能提升，但实际收益有限。问题的关键在于，互联网上约90%的数据质量不佳：模糊图像、错误标注和无关信息大量存在，直接拉低模型训练效率。优必选技术团队围绕这个痛点展开研究，提出“数据精炼”理念。其核心技术“数据米其林指南”通过七层过滤机制，从200亿条原始数据中筛选出1000万条高价值样本，强调以更少、更准的数据支撑更有效的训练。具体而言，该技术包括三项进展：通过多模态关联分析实现精细化数据清洗；建立七维评价体系，对数据质量进行星级评定；采用人机协同的闭环标注模式，将标注成本降至传统方法的1%。这一突破带来了明确的落地效果。在深圳某汽车工厂测试中，搭载Thinker系统的机器人表现出更强的环境适应能力——当传送带突然加速，系统可实时调整机械臂轨迹，减少传统机器人因处理延迟造成的零件损毁。在东莞某电子厂应用中，精密插件动作耗时由20秒缩短至8秒，良品率提升至99.92%，推动工业机器人效率指标实现提升。值得关注的是其开源策略。优必选将这项估值数十亿元的技术向全球开放，为行业协作提供了新的路径。分析人士认为，开放共享有助于加快智能制造技术迭代，促进更良性的产业生态形成。展望未来，该技术有望拓展到更多场景。据企业透露，下一步将重点突破“跨场景学习”，推动汽车制造经验向光伏等领域快速迁移。这既需要优化数据筛选算法，也需要建立跨行业的标准化评价体系。随着数据精炼技术普及，“少而精”的训练模式有望逐步替代粗放的数据堆砌，成为工业智能化转型的重要方向。

Thinker大模型的实践折射出科技竞争的新趋势：在人工智能时代，竞争力不再主要取决于数据规模和算力堆叠，而更依赖对数据价值的理解与提取能力；优必选以1%的数据量实现国际领先性能，说明关键突破来自方法论创新。“精准优于庞大”的思路，对全球工业智能制造具有启示意义，也显示中国企业正在新一轮产业竞争中形成新的技术优势。