视频生成(Veo)
Veo 视频生成是异步任务:接口提交成功后会返回 task_id,生成完成后到控制台任务中心下载视频。
接口与结果
模型选择
| 模型 | 建议场景 |
|---|---|
veo-3.1-generate-001 | 标准高清生产模型,适合最终成片 |
veo-3.1-fast-generate-001 | 快速生成模型,适合低延迟、短视频或广告快速迭代 |
提示词写法
建议使用英文提示词,并明确写出:
- 主体:人物、动物、产品或场景主角
- 动作:正在发生什么
- 镜头:
wide shot、close-up、dolly in、drone shot - 风格:写实、电影感、广告片、纪录片等
- 光线:日出、霓虹、柔光、逆光等
- 音频:对白、环境声、音效或背景音乐
示例:
A cinematic wide shot of a lone astronaut walking across a red desert at sunset, drifting dust, realistic lighting, subtle dolly-in camera movement. Soft wind and distant radio static in the background.
常用参数建议
| 参数 | 建议 |
|---|---|
duration | 顶层视频时长,常用 4、6、8 秒 |
metadata.durationSeconds | metadata 内的视频时长,建议与顶层 duration 保持一致 |
metadata.aspectRatio | 横版视频用 16:9,短视频用 9:16 |
metadata.resolution | 快速试创意用 720p,最终成片再用 1080p |
metadata.negativePrompt | 排除 blurry、low quality、shaky camera、text、watermark |
metadata.personGeneration | 控制人物生成策略,具体可用值以模型开放能力为准 |
metadata.generateAudio | Veo 3 / 3.1 需要音频时设为 true |
seed | 用于提高多次生成的相似度,但不保证完全复现 |
注意事项
- Veo 3 / 3.1 原生支持音频,通常把音频要求直接写进
prompt。 - 运镜和构图更推荐写在
prompt,不要假设存在统一的camera_control对象。 - 角色、商品或关键道具一致性优先使用参考图。
- 视频生成通常比文本和图片耗时更长,前端应按异步任务设计。