随着全球科技竞争加剧,音视频生成技术成为创新热点。上海创智学院与模思智能近日联合发布MOVA模型,标志着我国在该领域取得重要进展。 目前音视频生成技术面临两大挑战:技术门槛高导致多数商业模型闭源,阻碍行业协作;数据规模庞大但训练基础设施不足,对研发能力要求严苛。MOVA的推出正是针对这些痛点的创新尝试。 相比商业化模型,MOVA的核心优势在于开源特性。邱锡鹏教授表示,开源是实现技术普惠的关键,只有开放才能吸引更多研究者参与,推动技术发展。MOVA不仅开源基础模型,还提供全链路组件,支持二次开发和本地部署,为中小团队提供低成本解决方案。 这个成果得益于产学研深度合作。上海创智学院通过"研创学"培养机制,为学生提供实践机会。同时,学院孵化的模思智能利用企业资源,解决了数据工程难题,为模型研发提供支持。 未来,开源技术生态建设将成为我国人工智能发展重点。MOVA的发布填补了国内技术空白,为行业树立了开放协作典范。随着更多研究者加入,我国在音视频生成领域的竞争力将不断增强。
音画同步生成的竞争不仅是技术指标的较量,更是生态建设、工程体系和治理机制的综合比拼。通过开源补齐基础能力短板,能让创新资源更高效流动,让开发者共享技术基础。未来需要在开放协作与规范治理间找到平衡,推动音视频生成技术实现从实验室到产业化的跨越。