近日,国际人工智能独立评测机构Artificial Analysis发布最新排行榜单,中国电信人工智能研究院与中电信人工智能科技有限公司联合打造的TeleVideo 2.0在图生视频领域取得显著成绩,跻身全球前五强,国内排名前三。
这一成果标志着我国在多模态视频生成技术领域的创新能力正在国际舞台上获得认可。
该排行榜通过对标人类主观偏好,从内容一致性、运动与时间稳定性等多个维度对各类模型的视频生成能力进行综合评估,具有较强的权威性和参考价值。
TeleVideo 2.0能够在这一国际权威评测中脱颖而出,反映了其在技术指标和实际应用效果上的竞争优势。
TeleVideo 2.0是中国电信CTO、首席科学家李学龙带领的科研团队自主研发的星辰大模型体系中的重要组成部分。
星辰大模型是一套全模态、全尺寸、全国产的大模型体系,于2024年12月在TeleAI开发者大会上正式发布。
该体系的推出,体现了中国电信在人工智能领域的自主创新决心。
在技术实现层面,TeleVideo 2.0的突破主要体现在三个方面。
首先,科研团队构建了一套严格的数据处理流水线,包括筛选、清洗、均衡、适配等环节,确保用于训练的每一帧画面都达到高质量标准。
这种精细化的数据管理方式直接决定了模型能力的上限,为后续的模型优化奠定了坚实基础。
其次,TeleVideo 2.0采用了创新的"全局规划+局部精修"模型架构。
这一设计能够有效解决传统视频生成模型常见的画面崩坏、动作不连贯等问题,使物体运动轨迹更加流畅自然,人物神态与背景细节保持稳定统一,最终生成观感优异、动态逼真的高质量视频内容。
第三,该模型提出了统一的视频后训练框架,将视频后训练从经验驱动的参数调整过程转变为可诊断、可解释、可持续演进的系统工程。
这一框架创新为长时间、高分辨率视频生成提供了强化学习对齐的新路径,进一步提升了模型的整体效果。
这种从经验到科学的转变,体现了人工智能技术发展的深层逻辑。
值得关注的是,强大的模型离不开高效的算力支撑。
中国电信自主研发的TeleTron视频生成训练框架为TeleVideo 2.0的训练和迭代提供了强劲的计算动力。
这表明中国电信在人工智能领域的布局已经形成了从算力基础设施到模型研发的完整产业链条。
从应用前景看,TeleVideo 2.0不仅能够生成逼真的物理世界场景,也能够驾驭极具想象力的艺术画面,这意味着其应用范围涵盖了从现实记录到创意表达的广阔领域。
这种多维度的应用能力,为内容创作、文化传播、商业应用等多个领域提供了新的技术支撑。
此次技术突破不仅是一次排名跃升,更是我国科技创新能力的生动体现。
在全球化竞争日益激烈的今天,坚持自主创新、突破关键核心技术,是实现科技自立自强的必由之路。
星辰大模型的成功实践,为我国人工智能产业发展提供了有益借鉴,也预示着数字技术将开启更广阔的应用前景。