真诚欢迎您的来访，留言，投稿！欢迎（Ctrl+D）收藏并经常访问本站 —- https://mybj123.com
欢迎在本站投放广告，特意开通合作通道『立即了解详情』

当前位置：码云笔记 > AI头条 > 清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

玛利亚黑 AI头条 2024-04-28

清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

AI 概述

生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到 Sora 级别的视频大模型，标志着中国在视频生成技术领域的重要进展。 Vidu 的主要特点和技术创新包括: 模型结构: Vidu 采用了创新性的 U-ViT 架构，该架构融合了 Diffusion...

生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到 Sora 级别的视频大模型，标志着中国在视频生成技术领域的重要进展。

Vidu 的主要特点和技术创新包括:

模型结构: Vidu 采用了创新性的 U-ViT 架构，该架构融合了 Diffusion（扩散）与 Transformer 技术。

视频生成能力: Vidu 能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容，满足长视频内容的生成需求。

实际应用演示: 官方资料中的一个视频示例展示了“画室中的一艘船驶向镜头”的场景，船和海浪的逼真效果体现了 Vidu 的强大生成能力。

高级功能: Vidu 不仅能够模拟真实物理世界，还具备丰富的想象力，支持多镜头生成和高时空一致性，为视频创作提供了更多可能性。

技术先进性:

全球首创: Vidu 的 U-ViT 架构是全球首个将 Diffusion 与 Transformer 融合的架构，早于其他类似模型使用的技术。

开源成就:2023 年 3 月，团队开源了基于 U-ViT 架构的多模态扩散模型 UniDiffuser，这是全球首个此类模型，验证了 U-ViT 架构的大规模可扩展性。

以上关于清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频的文章就介绍到这了，更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章，希望大家以后多多支持码云笔记。

「点点赞赏，手留余香」

赞 0 赏

给作者打赏，鼓励TA抓紧创作！

微信

支付宝

还没有人赞赏，快来当第一个赞赏的人吧！

AI大模型 Vidu 人工智能大模型

声明：本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符，请将相关资料发送至 admin@mybj123.com 进行投诉反馈，一经查实，立即处理！
重要：如软件存在付费、会员、充值等，均属软件开发者或所属公司行为，与本站无关，网友需自行判断
码云笔记 » 清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

玛利亚黑普通

分享到：

相关推荐

字节跳动正式发布自研豆包大模型系列覆盖九大模型

字节跳动正式发布自研豆包大模型系列覆盖九大模型

李彦宏大模型“创业”400天

如何安装TensorFlow2.12.0？

如何安装TensorFlow2.12.0？

Archetype AI发布可深入理解世界的基础模型Newton

Archetype AI发布可深入理解世界的基础模型Newton

重磅！Anthropic 推出混合 AI 模型，速度与推理深度兼得，成本还可控

重磅！Anthropic 推出混合 AI 模型，速度与推理深度兼得，成本还可控

视频会议巨头Zoom强势“跨界”，联邦AI赋能创全球最难AI考试新纪录

视频会议巨头Zoom强势“跨界”，联邦AI赋能创全球最难AI考试新纪录

华为盘古大模型5.0、全新小艺将于6月21日发布

华为盘古大模型5.0、全新小艺将于6月21日发布

nanochat 大型语言模型

nanochat 大型语言模型

发表回复取消回复

要发表评论，您必须先登录。