Veo 3.1 API
使用文本和图像创建逼真的 AI 视频
价格对比
| 服务 | 官方价格 | 我们的价格 | 节省 |
|---|---|---|---|
| Veo 3.1 Fast (无音频) | $0.10/秒 | $0.30/8秒 | 节省 62.5% |
| Veo 3.1 Fast (含音频) | $0.15/秒 | $0.30/8秒 | 节省 75% |
💡 例如:5秒带音频的视频
官方价格:$0.75 | 我们的价格:仅需 $0.30
立即节省 60%!
什么是 Veo 3.1 API?
Google DeepMind AI 视频生成 API
Veo 3.1 API 是 Google DeepMind 最新的 AI 视频生成 API。它可以从文本提示或图像创建视频。您能获得逼真的物理效果、原生音频和创意控制。该 API 适用于需要快速获得高质量视频内容的开发者、电影制作者和创作者。它功能强大但使用简单。
文本转视频:将文本提示转换为具有逼真动作的高清视频片段
图像转视频:通过平滑过渡和物理效果让静态图像动起来
原生音频:生成同步的音效、对话和环境音频
创意控制:轻松指定相机角度、风格和物体移动
使用 Veo 3.1 API
生成视频的四个简单步骤
Step 1
选择文本转视频或图像转视频模式
Step 2
编写您的提示,包含相机角度和风格等细节
Step 3
设置视频长度、分辨率和音频偏好
Veo 3.1 API 核心功能
是什么让这个视频 API 与众不同
逼真的物理模拟
视频自动包含真实世界的物理效果,如重力、碰撞、光照和阴影
原生音频生成
获得与视频内容同步的音效、环境噪音、对话和背景音乐
高清视频输出
生成 720p 或 1080p 分辨率的视频,支持 16:9 或 9:16 宽高比
扩展和编辑工具
将片段扩展到 60 秒以上,添加或删除物体同时保持一致性
Frequently Asked Questions
Everything you need to know about our AI image editor
Veo 3.1 API 与其他视频 API 有什么不同?
Veo 3.1 API 在生成视频的同时生成原生音频。大多数视频 API 都不这样做。您可以获得与视觉效果完美同步的音效、对话和环境噪音。此外,它还包括重力、光照等真实物理模拟。
Veo 3.1 API 支持哪些视频格式?
Veo 3.1 API 输出 720p 或 1080p 的高清视频。您可以选择 16:9 的横屏模式或 9:16 的竖屏模式。视频开始时为 4、6 或 8 秒,但可以使用扩展功能延长到 60 秒或更长时间。
Veo 3.1 API 如何处理音频生成?
API 与视频同步创建原生音频。它生成音效(如雷声或引擎声)、环境噪音(如城市声音),甚至带角色声音的对话。音频与屏幕上发生的内容保持完美同步。
我可以使用 Veo 3.1 API 控制相机角度吗?
可以。Veo 3.1 API 允许您在文本提示中指定相机移动和角度。使用像移动镜头、俯视视图或低角度这样的术语。API 理解电影摄影语言并将其应用于生成的视频。
Veo 3.1 API 中的文本转视频是什么?
文本转视频意味着您编写描述,Veo 3.1 API 根据该文本生成视频。描述场景、动作、风格和您想要的音频。API 根据您的提示创建一切。就是这么简单。
图像转视频是如何工作的?
将静态图像上传到 Veo 3.1 API,它会将其动画化为视频片段。API 为您的图像添加动作、物理效果和音频。非常适合让照片活起来或在帧之间创建过渡效果。
Veo 3.1 API 适合商业项目吗?
绝对适合。Veo 3.1 API 专为专业用途而设计。开发者将其集成到应用程序中,电影制作者用它制作预览,企业创建营销内容。该 API 对于生产工作负载是可靠且可扩展的。
Veo 3.1 API 中有哪些安全功能?
来自 Veo 3.1 API 的所有视频都包含 SynthID 水印,以标识 AI 生成的内容。API 阻止有害内容生成。Google 在发布前已经测试了隐私、版权问题和偏见问题。
如何访问 Veo 3.1 API?
Veo 3.1 API 可通过 ai.google.dev/gemini-api 上的 Gemini API 访问。您也可以通过 Vertex AI 进行云部署或使用 Gemini App 进行快速测试。某些功能目前是付费预览版。
什么提示格式最适合 Veo 3.1 API?
使用这个结构:相机术语 + 主体 + 动作 + 设置 + 风格。示例:'中景镜头,疲惫的办公室职员,揉太阳穴,杂乱的1980年代办公室,复古电影颗粒感。' 通过在引号中指定对话或写 'SFX:' 来添加音效。