Buda AI - 视频生成

需要一段片段又不想离开聊天？吩咐智能体，它就会为你渲染一段。内置的视频生成工具接收一段提示词和可选的参考媒体（图片 / 视频 / 音频），在后台渲染视频，并把它直接放到智能体或空间 Drive（云盘）中的某个路径上——渲染期间你可以继续工作。

空间的「应用与技能」视图

工作方式速览

打开 Agent Settings → Tools → Video 并把该分组打开。如果你的账户里看不到这个分组，说明视频生成在你当前的环境中不可用——请联系你的管理员。

参数	必填	说明
`prompt`	是	对视频的自然语言描述
`file_path`	是	输出路径。相对路径落到智能体 Drive；`/space/...` 写入空间 Drive
`attachments`	否	参考媒体数组——每一项是一个 URL、资产 ID、Drive 路径字符串，或一个显式对象 `{ path? / url?, type?, role?, name?, mimeType? }`
`model`	否	覆盖默认模型
`durationSeconds`	否	4–15 秒
`aspectRatio`	否	`adaptive / 21:9 / 16:9 / 4:3 / 1:1 / 3:4 / 9:16`
`resolution`	否	`480p / 720p / 1080p`（并非每个模型都支持 1080p）
`generateAudio`	否	默认开启
`watermark`	否	默认关闭
`returnLastFrame`	否	索取最后一帧，以便衔接下一段片段
`webSearch`	否	为纯文本生视频的提示词允许参考性的网络搜索

如果你省略 role，系统会根据媒体类型选取一个合理的默认值。

能力因模型档位而异——根据你的需要挑选一个：

档位	文生视频	首帧	首+末帧	多模态参考（图/视频/音频）	编辑	延展	最高分辨率	时长
Flagship	✓	✓	✓	完整	✓	✓	1080p	4–15s
Flagship fast	✓	✓	✓	完整	✓	✓	720p	4–15s
Pro	✓	✓	✓	仅图片	✗	✗	1080p	4–12s
Lite i2v	✗	✓	✗	仅图片	✗	✗	720p	2–12s
Lite t2v	✓	✗	✗	✗	✗	✗	720p	2–12s

当 generateAudio: true 时，Flagship 档位可以输出音频。

图片——jpeg / png / webp / bmp / tiff / gif / heic / heif。每张 ≤ 30 MB，宽高比 0.4–2.5，边长 300–6000 px。数量：首帧 1 张，首+末帧 2 张，多模态参考 1–9 张，lite 参考 1–4 张。

视频——mp4 / mov，H.264 或 H.265 + AAC / MP3。每段 2–15 秒，最多 3 段，总计 ≤ 15 秒。480p / 720p / 1080p，24–60 fps。

音频——wav / mp3，每段 2–15 秒，最多 3 段，总计 ≤ 15 秒，每段 ≤ 15 MB。

公式：主体 + 动作，场景 + 动作，镜头 + 动作。