谷歌正式发布了其新一代视频生成模型 Veo2,旨在与 OpenAI 的 Sora 展开竞争。谷歌表示,Veo2在生成视频时表现出更高的真实感和细腻度。此次更新不仅提升了视频质量,还加强了对现实物理和人类运动与表情细微差别的理解。

Veo2体验入口:https://labs.google/fx/tools/video-fx

介绍入口:https://deepmind.google/technologies/veo/veo-2/

谷歌升级AI视频生成模型 Veo2,4K分辨率、人类偏好评分优于Sora

Veo2的强大功能

谷歌表示,Veo2“对现实世界的物理学以及人类运动和表情的细微差别有更好的理解”。它可以在 Google Labs 的 VideoFX 平台上使用,但仅限于候补名单。用户需要通过 Google 表单注册,并等待 Google 在其选择的时间临时授予访问权限。

谷歌介绍称,用户可以根据需求选择视频的类型、镜头和电影效果,Veo2将能够生成最高可达4K 分辨率的视频

与此相比,原版 Veo 仍然可在 Vertex AI 上使用,Veo2生成的视频将附带谷歌的元数据水印 SynthID,以便识别其为 AI 生成内容。

尽管 Veo2在技术上有所进步,谷歌也承认该模型偶尔会出现 “幻觉”,例如生成多余的手指,但总体上新版本产生的幻觉现象减少了。

谷歌表示,在它自己的内部测试中,衡量 “整体偏好”(即观众更喜欢哪些视频)和 “及时遵守”(视频与人类创作者给出的指示的匹配程度),人类评估者更喜欢Veo,而不是Sora和其他竞争对手的人工智能模型。

 

AI 视频生成仍需努力

尽管 AI 视频生成技术正在不断进步,谷歌与 OpenAI 等大厂商之间的竞争依然激烈。其他一些小型公司,如 RunwayML 和 Luma AI,也在不断推出新功能以增强其视频生成能力。

最近,RunwayML 推出了 Gen-3Alpha Turbo 模型的高级控制功能,而 Pika Labs 则发布了 Pika2.0,允许用户向视频中添加自己的角色。

然而,用户对 AI 生成视频的信任度依旧不足。Sora 的发布并没有彻底消除人们的质疑,部分用户反馈生成的结果存在物理和解剖学的违背现象。此外,近期的游戏颁奖典礼中,观众对 AI 生成内容的 “AI 混乱” 表示了不满。

谷歌表示,许多用户对 Veo2表示出浓厚的兴趣,尤其是一些 YouTube 创作者,已经在使用 VideoFX 来为其短视频制作背景,以节省时间。

Imagen3的更新

除了 Veo2,谷歌还更新了其图像生成模型 Imagen3,进一步提升了生成图像的真实感和色彩鲜艳度。新版本的 Imagen3能够更加准确地表现多种艺术风格,从摄影写实主义到印象派,再到抽象和动漫风格。同时,该模型还在遵循用户指令方面表现得更加出色。