Veo 3.1 API

价格对比

服务官方价格我们的价格节省
Veo 3.1 Fast (无音频)$0.10/秒$0.30/8秒节省 62.5%
Veo 3.1 Fast (含音频)$0.15/秒$0.30/8秒节省 75%

💡 例如:5秒带音频的视频

官方价格:$0.75 | 我们的价格:仅需 $0.30

立即节省 60%!

什么是 Veo 3.1 API?

Google DeepMind AI 视频生成 API

Veo 3.1 API 是 Google DeepMind 最新的 AI 视频生成 API。它可以从文本提示或图像创建视频。您能获得逼真的物理效果、原生音频和创意控制。该 API 适用于需要快速获得高质量视频内容的开发者、电影制作者和创作者。它功能强大但使用简单。

文本转视频:将文本提示转换为具有逼真动作的高清视频片段

图像转视频:通过平滑过渡和物理效果让静态图像动起来

原生音频:生成同步的音效、对话和环境音频

创意控制:轻松指定相机角度、风格和物体移动

使用 Veo 3.1 API

生成视频的四个简单步骤

1

Step 1

选择文本转视频或图像转视频模式

2

Step 2

编写您的提示,包含相机角度和风格等细节

3

Step 3

设置视频长度、分辨率和音频偏好

Veo 3.1 API 核心功能

是什么让这个视频 API 与众不同

逼真的物理模拟

视频自动包含真实世界的物理效果,如重力、碰撞、光照和阴影

原生音频生成

获得与视频内容同步的音效、环境噪音、对话和背景音乐

高清视频输出

生成 720p 或 1080p 分辨率的视频,支持 16:9 或 9:16 宽高比

扩展和编辑工具

将片段扩展到 60 秒以上,添加或删除物体同时保持一致性

Frequently Asked Questions

Everything you need to know about our AI image editor

Q

Veo 3.1 API 与其他视频 API 有什么不同?

Veo 3.1 API 在生成视频的同时生成原生音频。大多数视频 API 都不这样做。您可以获得与视觉效果完美同步的音效、对话和环境噪音。此外,它还包括重力、光照等真实物理模拟。

Q

Veo 3.1 API 支持哪些视频格式?

Veo 3.1 API 输出 720p 或 1080p 的高清视频。您可以选择 16:9 的横屏模式或 9:16 的竖屏模式。视频开始时为 4、6 或 8 秒,但可以使用扩展功能延长到 60 秒或更长时间。

Q

Veo 3.1 API 如何处理音频生成?

API 与视频同步创建原生音频。它生成音效(如雷声或引擎声)、环境噪音(如城市声音),甚至带角色声音的对话。音频与屏幕上发生的内容保持完美同步。

Q

我可以使用 Veo 3.1 API 控制相机角度吗?

可以。Veo 3.1 API 允许您在文本提示中指定相机移动和角度。使用像移动镜头、俯视视图或低角度这样的术语。API 理解电影摄影语言并将其应用于生成的视频。

Q

Veo 3.1 API 中的文本转视频是什么?

文本转视频意味着您编写描述,Veo 3.1 API 根据该文本生成视频。描述场景、动作、风格和您想要的音频。API 根据您的提示创建一切。就是这么简单。

Q

图像转视频是如何工作的?

将静态图像上传到 Veo 3.1 API,它会将其动画化为视频片段。API 为您的图像添加动作、物理效果和音频。非常适合让照片活起来或在帧之间创建过渡效果。

Q

Veo 3.1 API 适合商业项目吗?

绝对适合。Veo 3.1 API 专为专业用途而设计。开发者将其集成到应用程序中,电影制作者用它制作预览,企业创建营销内容。该 API 对于生产工作负载是可靠且可扩展的。

Q

Veo 3.1 API 中有哪些安全功能?

来自 Veo 3.1 API 的所有视频都包含 SynthID 水印,以标识 AI 生成的内容。API 阻止有害内容生成。Google 在发布前已经测试了隐私、版权问题和偏见问题。

Q

如何访问 Veo 3.1 API?

Veo 3.1 API 可通过 ai.google.dev/gemini-api 上的 Gemini API 访问。您也可以通过 Vertex AI 进行云部署或使用 Gemini App 进行快速测试。某些功能目前是付费预览版。

Q

什么提示格式最适合 Veo 3.1 API?

使用这个结构:相机术语 + 主体 + 动作 + 设置 + 风格。示例:'中景镜头,疲惫的办公室职员,揉太阳穴,杂乱的1980年代办公室,复古电影颗粒感。' 通过在引号中指定对话或写 'SFX:' 来添加音效。