腾讯版Sora视频生成模型震撼发布，发布即开源

腾讯版Sora视频生成模型震撼发布，发布即开源

2024-12-03 16:54:15

腾讯版Sora视频生成模型震撼发布，发布即开源

根据AITOP100平台获悉，腾讯公司正式推出了其自主研发的视频生成模型——腾讯版Sora，并宣布该模型即日起在GitHub与Hugging Face平台全面开源。作为目前参数量最大的开源视频生成模型，Sora的发布无疑为国内AI视频生成领域注入了新的活力。

目前已知参数是130亿，成为当前参数量最大的开源视频生成模型。其模型的权重、推理代码、模型算法等全部上传GitHub和Hugging Face，这次是一点也没藏着。

腾讯版Sora模型凭借其超写实画质、高语义一致、运动画面流畅以及原生镜头转换等四大特点，迅速吸引了业界的广泛关注。其高清质感和真实感使得生成的视频内容能够直接应用于工业级商业场景，为广告、影视等行业带来了全新的创作可能。同时，Sora模型能够准确表达出文本的内容，确保生成的视频与用户的创意需求高度契合。

在实测中，腾讯版Sora模型展现出了出色的性能。无论是冲浪题材中的流畅运镜，还是镜子题材中对光影的细腻处理，Sora都表现出了卓越的视频生成能力。尤其值得一提的是，Sora模型原生具备自动生成多视角同主体的镜头切换画面功能，这一能力在业界大部分模型中都是不具备的，进一步提升了视频叙事的丰富性和观赏性。

技术方面，腾讯版Sora模型同样亮点频出。其文本编码器适配了新一代多模态大语言模型，使得模型的语义跟随能力更加强大；自研的3D视觉编码器则支持混合图片/视频训练，有效提升了压缩重建性能；而全注意力机制的采用，则确保了画面流畅度的大幅提升。这些技术亮点的融合，使得Sora模型在文本视频一致性、运动质量和画面质量等多个维度上都取得了领先的效果。

为了让更多用户能够体验到Sora模型的魅力，腾讯公司已经将Sora模型上线至腾讯元宝APP的AI应用中的“AI视频”板块。用户可以在此申请试用，感受Sora模型带来的全新视频生成体验。同时，腾讯还同步开放了API测试，开发者可以通过腾讯云接入，进一步拓展Sora模型的应用场景。

腾讯元宝APP中目前每天免费生成3次：

腾讯公司已经将Sora模型上线至腾讯元宝APP的AI应用中的“AI视频”板块

prompt提示词用法（官方的写prompt小tips）：

用法1：提示词=主体+场景+运动

用法2：提示词=主体(主体描述)+场景(场景描述)+运动(运动描述)+(镜头语言)+(氛围描述)+(风格表达)

用法3：提示词=主体+场景+运动+(风格表达)+(氛围描述)+(运镜方式)+(光线)+(景别)

多镜头生成：提示词=[场景1]+镜头切换到[场景2]

两个动作生成：提示词=[主体描述]+[动作描述]+[然后、过了一会等连接词]+[动作描述2]

实测视频展示效果：

总结而言，腾讯版Sora视频生成模型的发布即开源，不仅为AI视频生成领域带来了新的突破和机遇，也为广大开发者和用户提供了更加便捷、高效的视频创作工具。我们期待在未来的日子里，能够看到更多基于Sora模型的精彩作品和创意应用。

，腾讯版Sora视频生成模型的发布即开源

各位看官老爷，元元给大家总结如下：

模型介绍：

模型名称：腾讯版Sora
参数量：130亿，是目前参数量最大的开源视频生成模型
开源平台：GitHub与Hugging Face

模型特点：

超写实画质：具备高清质感、真实感，可用于工业级商业场景
高语义一致：能够准确表达出文本的内容
运动画面流畅：可生成大幅度的合理运动，不易变形
原生镜头转换：模型原生具备自动生成多视角同主体的镜头切换画面

实际应用：

上线平台：腾讯元宝APP的AI应用中的“AI视频”板块
试用申请：用户可在上述平台申请试用
API测试：同步开放测试，开发者可通过腾讯云接入

实测效果：

冲浪题材：表现出流畅运镜的能力，但在“最后定格在…”的要求上稍显不足
镜子题材：考验模型对光影的理解及镜子内外主体运动的一致性，但在幽灵脚部细节上有所欠缺
多镜头切换：表现优秀，是业界大部分模型所不具备的能力

技术亮点：

文本编码器：适配新一代多模态大语言模型，获得更强大的语义跟随能力
视觉编码器：自研3D视觉编码器，支持混合图片/视频训练，提升压缩重建性能
全注意力机制：从头到尾用full attention机制，没有用时空模块，提升画面流畅度

官方评估：

腾讯混元视频生成模型在文本视频一致性、运动质量和画面质量多个维度效果领先

prompt用法提示：

提示词用法：给出了多种提示词组合的用法，帮助用户更好地使用模型

总结：腾讯版Sora是一款具备高画质、高语义一致、运动画面流畅及原生镜头转换等特点的开源视频生成模型，用户可在腾讯元宝APP申请试用，并通过腾讯云接入API。其技术亮点包括适配新一代多模态大语言模型的文本编码器、自研3D视觉编码器及全注意力机制。官方评估显示，该模型在多个维度效果领先。

官网：https://aivideo.hunyuan.tencent.com

代码：https://github.com/Tencent/HunyuanVideo

模型：https://huggingface.co/tencent/HunyuanVideo

更多实用AI工具推荐请关注AI 人工智能网站--AITOP100平台--AI工具集

0

0

免责声明：本文不代表本平台立场，且不构成投资建议，请谨慎对待。

相关AI工具

热点资讯

DeepSeek发布Janus-Pro-7B文生图大模型，进军文生图领域

DeepSeek发布Janus-Pro-7B文生图大模型，进军文生图领域

DeepSeek-R1：揭秘AI新星的技术、文化与未来影响

DeepSeek-R1：揭秘AI新星的技术、文化与未来影响

DeepSeek启示：算力优化新思路，系统软件成AI突围关键

DeepSeek启示：算力优化新思路，系统软件成AI突围关键

DeepSeek-R1引发全球震撼：中国大模型崛起，RAG技术成关键

DeepSeek-R1引发全球震撼：中国大模型崛起，RAG技术成关键

DeepSeek V3 另辟蹊径：PTX优化挑战英伟达CUDA，AI或将自我优化底层代码

DeepSeek V3 另辟蹊径：PTX优化挑战英伟达CUDA，AI或将自我优化底层代码

分享

0

0

欢迎来到AI Top100！我们聚合全球500+款AI智能软件，提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台，让您轻松了解全球AI领域动态，并为您提供优质服务。

合作伙伴

联系我们

加入AITOP100社群

加入社群

AITOP100商务微信

商务微信

相关链接

服务及隐私政策