咱们国家在AI视频这块的研究最近可是给全世界亮了相。根据Artificial Analysis出的那个榜单,Image to Video Leaderboard,中国电信人工智能研究院(TeleAI)和中电信人工智能科技有限公司联合搞出来的一个叫TeleVideo 2.0的多模态视频大模型,已经冲进了全球前三名。这个榜单主要是看人类觉得谁顺眼,还有画面顺不顺溜、时间接不接得上这些东西。 大家都知道这是星辰多模态视频生成大模型的一部分,它是在2024年12月的TeleAI开发者大会上正式拿出来的。这个模型可是中国电信首席科学家李学龙带队搞的,是他们星辰大模型体系里专门用来做视频生成的关键武器。 这次成绩这么好,主要是因为技术上有突破。以前视频老是画面失真或者动作断掉,现在的TeleVideo 2.0搞了个新招,叫“全局规划与局部精修协同”,也就是先给画面定个大方向,再把每一帧的细节抠细了。这样出来的视频物理上看着真,动起来也平滑,观感特别自然。 这种本事离不开数据和算法的支持。TeleAI他们搞了一套严丝合缝的数据治理流水线,把数据筛干净、配平衡,从源头上保证了数据质量。在算力这块儿,他们用了自己研发的TeleTron视频生成训练框架,给大模型的训练提供了一个高效又稳定的国产算力底座。 更绝的是他们弄了个统一的视频后训练框架,把以前那种靠感觉调参数的老办法变成了能诊断、能解释的系统工程。这让模型生成长视频和高清视频变得更顺手了,整个训练流程也更科学、更规范了。 现在这项技术已经开始用起来了。基于TeleVideo 2.0的核心能力,TeleAI推出了个叫TeleStudio的平台。这是中央企业第一个覆盖“文生图、文生视频、图生视频、角色驱动”的AI视频创作平台。它就是要把这门高级手艺变成人人都会用的工具,让开发者和企业都能用上。 现在基于这个平台的视频大赛已经开始了,目的就是让大家都来动动手脑,看看AI视频能变出多少花样。TeleVideo 2.0在国际权威评测中拿了好成绩,证明咱们国家在搞前沿技术时一直在坚持自主创新。从底层算法到数据处理再到训练框架全是自己搞的,不光技术更安全了,还给下面的产业应用打下了好底子。 随着TeleStudio这种平台落地生根,这项技术就真的从实验室走进了市场。不管是做数字内容、媒体传播还是教育培训,估计都能发挥大作用。这说明咱们国家在人工智能产业方面技术研发和生态建设这两条腿走路走得越来越稳当啦!