江苏省制造业出了个数据治理的参考手册，给“采不准”和“格式乱”这种难题提供了解决方法。

最近江苏省给咱们制造业领域出了个数据治理的参考手册，给“采不准”和“格式乱”这种难题提供了解决方法。这个手册叫做《江苏省制造业领域面向人工智能的数据治理工作参考指引(2026年版)》，是省工信厅还有国家工业信息安全发展研究中心一块搞出来的。他们就是想告诉大家怎么系统化地管好数据，把人工智能技术用好。大家都知道，搞人工智能得靠高质量数据来训练模型和做推理。而管好数据质量，就是保障核心的关键环节了。现在AI应用越来越深，反过来也逼着数据治理工作从以前的被动合规变成现在的主动创造价值。不过现在制造业里头有个通病：数据孤岛和失真很严重，标准也跟不上趟，跟应用场景也对不上。这给高质量、场景化数据集的供给带来了很大麻烦。省工信厅信息化发展处那边的负责人给大家介绍了下新版指引。这个指引把31个人工智能典型应用场景都考虑进去了。还根据企业的不同水平分成了入门、基础、进阶三个等级。不管是大企业还是中小企业，只要是想搞AI应用的典型场景都能找到合适的方案去参照和部署。手册里专门针对采集、预处理、特征工程、标注、划分和增强这六个核心环节给了治理路径。企业可以看看自己有什么技术底子、资源条件和实际业务上的痛点，选几个环节把技术落地进去，把数据的价值最大化挖出来。比如说在采集的时候，咱们经常碰到的问题就是“采不到”、“采不准”、“采不全”，还有“格式乱”、“分布散”、“溯源难”等等。预处理的时候也是一样的问题。所以呢，手册里每个环节都列出了核心技术和配套工具的清单。企业可以对照这些问题去解决它们。（付奇）