听说2023年11月的时候,凤凰卫视在那北京跟海天瑞声签了约,想把中文数据变成AI的粮食。凤凰卫视执行副总裁李奇和海天瑞声的创始人贺琳都在场,商量了不少事儿。他们说凤凰卫视最近在AI大模型上花了不少心思,2023年11月还推出了自家的AI数据集。 那边香港是全球战略的一个枢纽,凤凰卫视要把中国的数据能力和全球的AI需求连起来。就在签合同的前一天,海天瑞声还是世界数据组织(WDO)的发起单位呢,去北京参加了成立仪式。这次合作是要给数据做个升级。 贺琳觉得凤凰卫视的数据资源好,质量高、时间长、多模态,版权也清清爽爽的,是AI时代的战略资源。海天瑞声有20年的平台、算法和供应链体系,能把原始数据变成高附加值的产品。他们还能处理300多种语言和跨模态的数据,国际标准也都有了。 双方打算把版权确权、加工、适配这些环节做成标准化流程,好让数据资产能流通。针对中文大模型在文化理解上的难点,他们想开发些有中华文化特色的数据集。把文化内容变成机器能懂的语言,不光能提升AI系统对中文的认知,还能给全球用户更好的解读方案。 这次合作还特别强调要构建完整的数据生态闭环。就像凤凰智媒已经建起了端到端的体系,开发出粤语数据和跨文化认知对齐的东西。他们已经给好多家头部AI企业提供支持了,覆盖了训练、微调、评测这些关键环节。 这事儿还挺有意义的。通过这种协作,大家就能更好地助力中华文化在智能时代的创造性转化啦。