阿里云通义万相2.1视频生成模型推出：登顶VBench榜单，支持中文文字生成-AITOP100,AI资讯

阿里云通义万相2.1视频生成模型推出：登顶VBench榜单，支持中文文字生成

AITOP100平台获悉，2025年1月9日，阿里云旗下的通义万相视频生成模型迎来了2.1版的重磅升级，这一消息在业界引起了广泛关注。据悉，新发布的模型包括极速版和专业版两个版本，分别针对不同场景和需求进行优化：极速版注重高效性能，专业版瞄准卓越表现力。

技术突破

此次升级，通义万相在多个方面取得了显著进展。特别是在处理复杂运动、还原真实物理规律、提升电影质感及优化指令遵循方面，通义万相2.1展现出了前所未有的能力。通过先进的算法优化和数据训练，模型能够生成更加逼真、生动的视频内容，让观众仿佛置身于电影场景中。

从实际效果来看，通义万相2.1的表现确实令人惊艳。以经典的“切牛排”场景为例：

模型生成的画面中，牛排的纹理清晰可见。
刀锋沿着肌肉纤维缓缓切入，肉质Q弹。
细节处理得恰到好处。

通义万相视频-切牛排

而在人物特写生成方面，模型同样表现出色：

小女孩的面部表情、手部和肢体动作都自然协调，完全符合运动规律。

通义万相2.1-小女孩面部笑容

登顶VBench榜单

不仅如此，通义万相2.1还成功登顶了权威视频生成评测榜单VBench。在榜单上，它以总分84.7%的成绩超越了国内外众多知名视频生成模型，如Gen3、Pika、CausVid等，彰显了其强大的实力和竞争力。这一成绩不仅是对通义万相团队努力的肯定，也是对中国人工智能技术在视频生成领域取得重大突破的见证。

通义万相登顶VBench榜单

榜单链接： https://huggingface.co/spaces/Vchitect/VBench_Leaderboard

首个支持中文文字生成的AI视频生成模型

除了技术上的突破，通义万相2.1还带来了更加丰富的应用场景。例如：

它成为了首个支持中文文字生成能力、同时支持中英文文字特效生成的视频生成模型。这意味着用户在使用通义万相2.1时，可以轻松生成具有电影级效果的文字和动画，为视频内容增添更多趣味性和互动性。

例如：提示词：一只橘猫正在电脑前打字，画面依次跳出「不工作就没饭吃」这7 个大字

再例如：一个橘黄色的正方体小盒子里跳出英文单词「Synced」

它支持多种艺术风格的视频生成，如卡通、电影色、3D风格、油画、古典等。无论是制作科幻电影中的外星船探索场景，还是打造可爱的3D动画小怪兽，通义万相2.1都能轻松胜任。

此外，通义万相2.1还支持不同长宽比的视频输出，能够更好地适配电视、电脑、手机等不同终端设备。

展望未来

此次通义万相2.1的升级不仅提升了模型的整体性能，更为视频生成技术的应用开辟了更加广阔的空间。随着人工智能技术的不断发展，我们有理由相信，通义万相将在未来继续引领视频生成技术的潮流，为观众带来更多精彩纷呈的视觉盛宴。

用户现在即可在通义万相官网体验最新一代模型，开发者也可以在阿里云百炼平台上调用大模型API进行开发和应用。通义万相2.1的推出标志着人工智能技术在视频生成领域又迈出了坚实的一步，让我们共同期待它在未来带来的更多惊喜吧！

通义万相视频AI工具地址：【点击登录】

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集