AITOP100平台获悉,2025年1月9日,阿里云旗下的通义万相视频生成模型迎来了2.1版的重磅升级,这一消息在业界引起了广泛关注。据悉,新发布的模型包括极速版和专业版两个版本,分别针对不同场景和需求进行优化:极速版注重高效性能,专业版瞄准卓越表现力。
技术突破
此次升级,通义万相在多个方面取得了显著进展。特别是在处理复杂运动、还原真实物理规律、提升电影质感及优化指令遵循方面,通义万相2.1展现出了前所未有的能力。通过先进的算法优化和数据训练,模型能够生成更加逼真、生动的视频内容,让观众仿佛置身于电影场景中。
从实际效果来看,通义万相2.1的表现确实令人惊艳。以经典的“切牛排”场景为例:
- 模型生成的画面中,牛排的纹理清晰可见。
- 刀锋沿着肌肉纤维缓缓切入,肉质Q弹。
- 细节处理得恰到好处。
而在人物特写生成方面,模型同样表现出色:
- 小女孩的面部表情、手部和肢体动作都自然协调,完全符合运动规律。
登顶VBench榜单
不仅如此,通义万相2.1还成功登顶了权威视频生成评测榜单VBench。在榜单上,它以总分84.7%的成绩超越了国内外众多知名视频生成模型,如Gen3、Pika、CausVid等,彰显了其强大的实力和竞争力。这一成绩不仅是对通义万相团队努力的肯定,也是对中国人工智能技术在视频生成领域取得重大突破的见证。
榜单链接: https://huggingface.co/spaces/Vchitect/VBench_Leaderboard
首个支持中文文字生成的AI视频生成模型
除了技术上的突破,通义万相2.1还带来了更加丰富的应用场景。例如:
它成为了首个支持中文文字生成能力、同时支持中英文文字特效生成的视频生成模型。这意味着用户在使用通义万相2.1时,可以轻松生成具有电影级效果的文字和动画,为视频内容增添更多趣味性和互动性。
例如:提示词:一只橘猫正在电脑前打字,画面依次跳出「不工作就没饭吃」这7 个大字
再例如:一个橘黄色的正方体小盒子里跳出英文单词「Synced」
它支持多种艺术风格的视频生成,如卡通、电影色、3D风格、油画、古典等。无论是制作科幻电影中的外星船探索场景,还是打造可爱的3D动画小怪兽,通义万相2.1都能轻松胜任。
此外,通义万相2.1还支持不同长宽比的视频输出,能够更好地适配电视、电脑、手机等不同终端设备。
展望未来
此次通义万相2.1的升级不仅提升了模型的整体性能,更为视频生成技术的应用开辟了更加广阔的空间。随着人工智能技术的不断发展,我们有理由相信,通义万相将在未来继续引领视频生成技术的潮流,为观众带来更多精彩纷呈的视觉盛宴。
用户现在即可在通义万相官网体验最新一代模型,开发者也可以在阿里云百炼平台上调用大模型API进行开发和应用。通义万相2.1的推出标志着人工智能技术在视频生成领域又迈出了坚实的一步,让我们共同期待它在未来带来的更多惊喜吧!
通义万相视频AI工具地址:【点击登录】