​字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3

在近期的人工智能视频生成领域,字节跳动(TikTok 的母公司)悄然发布了一款名为 Seedance1.0 的新模型,该模型在独立的评测中已经超越了谷歌最新推出的 Veo3。Veo3 以其音频合成和电影级工具而受到广泛关注,但 Seedance1.0 的技术实力却令人刮目相看,成为视频生成的领头羊。

Seedance1.0 的研究论文中详细介绍了该模型的创新之处。字节跳动的团队通过对空间和时间层的解耦,结合了多模态位置编码,从而使得该模型能够同时处理文本到视频和图像到视频的生成任务。这样的方法支持复杂的场景切换和多镜头叙事,保持了一致的主题表现。

​字节跳动推出的 AI 视频生成模型 Seedance 1.0 悄然超越谷歌 Veo 3

此外,Seedance1.0 的性能离不开字节跳动强大的数据管道。团队精心构建了一个大规模、多来源的数据集,配有详细的双语注释和丰富的动作与静态特征标注,确保生成内容的准确性。同时,采用了一种新颖的强化学习设置,结合了三个奖励模型,重点关注基础对齐、动作质量和美观度。

字节跳动推出的 AI 视频生成模型 Seedance 1.0 悄然超越谷歌 Veo 3

在评测中,Seedance1.0 在多个维度上超过了 Veo3。在与电影导演合作开发的 SeedVideoBench 基准测试中,该模型在遵循提示和动作真实感方面取得了更高的分数。在图像到视频的任务中,Seedance 保持了输入帧的视觉一致性,而 Veo3 则在某些情况下出现了光照和纹理的变化。

Seedance1.0 在多个维度上超过了 Veo3

在推理性能方面,Seedance1.0 也表现出色。该模型能够在 41.4 秒内生成一段 1080p 的五秒视频,这一速度远超其他竞争对手,如 Sora、Runway Gen-4 和 Veo3。字节跳动还表示,他们在降低成本和延迟方面取得了重大进展,使得视频生成向实时应用的目标迈进了一步。

Seedance1.0 计划于 2025 年 6 月集成到 Doubao 和 Jimeng 等平台,旨在显著改善专业工作流程和常规创作任务。虽然 Veo3 因首次结合了真实视频与环境音效和对话而备受瞩目,但 Seedance1.0 在视觉保真度、运动稳定性和叙事连贯性方面表现更为出色,虽然在音频能力上有所欠缺

以上关于​字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。

「点点赞赏,手留余香」

0

给作者打赏,鼓励TA抓紧创作!

微信微信 支付宝支付宝

还没有人赞赏,快来当第一个赞赏的人吧!

声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
码云笔记 » ​字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3

发表回复