谷歌发布Veo 3.1视频生成模型:新增音频功能和精细化编辑能力
谷歌近日推出了视频生成模型 Veo3.1,这是对今年 5 月发布的 Veo3 的升级版本。新版本在音频输出、编辑控制粒度和图像转视频质量等方面实现了改进,能够生成更真实的视频片段并更准确地遵循用户提示指令。

在功能层面,Veo3.1 允许用户向视频中添加新对象,系统会自动将其融入原有画面风格。谷歌还透露,即将在其视频编辑工具 Flow 中支持从视频中移除现有对象的功能,进一步增强编辑灵活性。
Veo3 此前已经提供了多项编辑特性,包括通过参考图像驱动角色生成、提供首尾帧由 AI 生成中间内容,以及基于末尾帧扩展现有视频等功能。Veo3.1 的核心升级在于为所有这些编辑功能增加了音频生成能力,使输出的视频片段具备声音元素,提升了内容的完整性和沉浸感。
从部署渠道来看,Veo3.1 将通过多个平台向用户开放。谷歌正在将该模型集成到视频编辑器 Flow、Gemini 应用程序,以及面向开发者的 Vertex AI 和 Gemini API 接口中。据谷歌披露的数据,自 Flow 在 5 月上线以来,用户已在该平台上创作了超过 2.75 亿个视频。
这次更新体现了 AI 视频生成技术在两个方向上的演进。一方面是生成质量的持续提升——更真实的画面、更准确的提示词理解;另一方面是编辑能力的细化——从整体生成到局部修改、对象增删等精细操作。音频生成的加入则填补了此前 AI 视频工具普遍缺乏声音元素的短板。
不过从技术成熟度来看,AI 视频生成仍处于快速迭代阶段。视频的连贯性、物理规律的准确性、复杂场景的处理能力等方面,各家模型都在持续改进中。Veo3.1 的实际表现,包括音频与画面的同步质量、对象融合的自然度等细节,还需要通过用户实际使用来验证。
以上关于谷歌发布Veo 3.1视频生成模型:新增音频功能和精细化编辑能力的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » 谷歌发布Veo 3.1视频生成模型:新增音频功能和精细化编辑能力
微信
支付宝