谷歌升级AI视频生成模型 Veo2，4K分辨率、人类偏好评分优于Sora

谷歌正式发布了其新一代视频生成模型 Veo2，旨在与 OpenAI 的 Sora 展开竞争。谷歌表示，Veo2在生成视频时表现出更高的真实感和细腻度。此次更新不仅提升了视频质量，还加强了对现实物理和人类运动与表情细微差别的理解。

Veo2体验入口:https://labs.google/fx/tools/video-fx

介绍入口：https://deepmind.google/technologies/veo/veo-2/

Veo2的强大功能

谷歌表示，Veo2“对现实世界的物理学以及人类运动和表情的细微差别有更好的理解”。它可以在 Google Labs 的 VideoFX 平台上使用，但仅限于候补名单。用户需要通过 Google 表单注册，并等待 Google 在其选择的时间临时授予访问权限。

谷歌介绍称，用户可以根据需求选择视频的类型、镜头和电影效果，Veo2将能够生成最高可达4K 分辨率的视频。

与此相比，原版 Veo 仍然可在 Vertex AI 上使用，Veo2生成的视频将附带谷歌的元数据水印 SynthID，以便识别其为 AI 生成内容。

尽管 Veo2在技术上有所进步，谷歌也承认该模型偶尔会出现 “幻觉”，例如生成多余的手指，但总体上新版本产生的幻觉现象减少了。

谷歌表示，在它自己的内部测试中，衡量 “整体偏好”（即观众更喜欢哪些视频）和 “及时遵守”(视频与人类创作者给出的指示的匹配程度)，人类评估者更喜欢Veo，而不是Sora和其他竞争对手的人工智能模型。

AI 视频生成仍需努力

尽管 AI 视频生成技术正在不断进步，谷歌与 OpenAI 等大厂商之间的竞争依然激烈。其他一些小型公司，如 RunwayML 和 Luma AI，也在不断推出新功能以增强其视频生成能力。

最近，RunwayML 推出了 Gen-3Alpha Turbo 模型的高级控制功能，而 Pika Labs 则发布了 Pika2.0，允许用户向视频中添加自己的角色。

然而，用户对 AI 生成视频的信任度依旧不足。Sora 的发布并没有彻底消除人们的质疑，部分用户反馈生成的结果存在物理和解剖学的违背现象。此外，近期的游戏颁奖典礼中，观众对 AI 生成内容的 “AI 混乱” 表示了不满。

谷歌表示，许多用户对 Veo2表示出浓厚的兴趣，尤其是一些 YouTube 创作者，已经在使用 VideoFX 来为其短视频制作背景，以节省时间。

Imagen3的更新

除了 Veo2，谷歌还更新了其图像生成模型 Imagen3，进一步提升了生成图像的真实感和色彩鲜艳度。新版本的 Imagen3能够更加准确地表现多种艺术风格，从摄影写实主义到印象派，再到抽象和动漫风格。同时，该模型还在遵循用户指令方面表现得更加出色。

声明：本站资源来自会员发布以及互联网公开收集，不代表本站立场，仅限学习交流使用，请遵循相关法律法规，请在下载后24小时内删除。如有侵权争议、不妥之处请联系本站删除处理！请用户仔细辨认内容的真实性，避免上当受骗！