楼向平:要建设高质量数据集

今年,“智能经济”被写进了政府工作报告,这是头一回。报告里面说,要把数据资源开发利用得更透彻,把数据要素基础制度建设好,还要建设高质量数据集。楼向平代表,他是中国移动上海公司的董事长,这次全国人大会议上,他对这事挺有感触。他觉得,数据现在跟以前不一样了。以前它就是电脑里存着的一堆记录,现在它成了AI的“大脑”,是支撑AI做决策的关键燃料和原料。楼向平觉得,这个时候我们必须得给数据要素搭建个高效、安全的市场环境,不然以后就抢不到先机了。建设数据要素新型试验区可不是件容易事。楼向平看到了不少问题:高质量数据不多,好多有价值的数据还在沉睡中没有被利用;数据流通交易机制不完善,两边都不知道对方有什么货,怕泄露风险;懂数据的人和懂AI的人没合作好。 为了解决这些难题,楼向平建议我们先选几个地方搞试点,试试把数据要素和人工智能一起发展。他说要把制度创新和技术创新结合起来做。制度方面要搞数据目录化管理、跨区域跨行业互信流通还有跨境数据监管;技术方面可以以大模型训练所需的语料为突破口,搞安全流通技术。 然后还要打通数据从源头到应用全链路。楼向平计划先做好“食材储备”,把高质量的数据集弄出来供AI学习用;接着搭好“中央厨房”,构建数据和产业融合的综合枢纽平台。这样就能让数据流起来、用得好。“最后咱们就能形成一套可复制的数据配置模式了。”楼向平说,“咱们把‘菜谱’做好了,以后各地都能照着做。”他觉得这件事太重要了,能给咱们国家的新生产力发展和中国式现代化推进打好基础。