视频大模型Vidu正式全球上线

科技|来源：科技日报2024-07-31 16:05:24|网络编辑：夏汝

科技日报记者崔爽

7月30日，曾于四月底亮相中关村论坛的AI生成视频大模型Vidu正式上线，开放给全球用户使用。Vidu开放文生视频、图生视频两大核心功能，提供4s和8s两种时长选择，分辨率最高达1080P。

Vidu是北京生数科技有限公司（以下简称生数科技）联合清华大学发布的国内首个自研长时长、高一致性、高动态性视频大模型，该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT，支持一键生成长达16秒、分辨率达1080P的高清视频。

据介绍，此次面向全球上线，Vidu在保持高动态性、高逼真度、高一致性等效果优势的同时，新增了角色一致性（Character To Video）、动漫风格、文字与特效画面生成等特色能力。生数科技方面表示，Vidu实现了业界最快的实测推理速度，生成一段4秒片段仅需30秒。目前Vidu无需申请，用户直接使用邮箱注册即可上手体验。

据介绍，目前业界对类Sora视频模型的评价主要围绕三大核心维度：语义理解准确性、画面美观性、主体动态的一致性。Vidu能够准确理解并生成提示词中的文字，包括字母、数字等，并能生成文字特效。对于第一人称、延时摄影等镜头语言，Vidu也能精准表达，用户只需细化提示词，即可大幅提升视频的可控性。同时，Vidu支持大幅度、精准的动作生成，保持高流畅、高动态的画面效果。

在画面质感上，Vidu在构图、叙事和光影等方面，能达到接近电影级效果。此外，Vidu还能生成影视级特效画面，如烟雾、炫光效果、CG特效等。

猜你喜欢：

网友评论 [新闻评论服务协议]