影片生成
用內建的 generate_video 工具把文本或參考媒體變成影片。
需要一段片段又不想離開聊天?吩咐智慧體,它就會為你渲染一段。內建的影片生成工具接收一段提示詞和可選的參考媒體(圖片 / 影片 / 音訊),在後臺渲染影片,並把它直接放到智慧體或空間 Drive(雲盤)中的某個路徑上——渲染期間你可以繼續工作。

工作方式速覽
- **非同步。**呼叫會立即返回;影片渲染時你可以繼續聊天。
- **寫入 Drive。**成功後影片會落到你選定的路徑上,訊息氣泡會顯示一張預覽卡片。
- **可取消。**排隊中或執行中的任務可以從聊天介面停止。
啟用該工具
開啟 Agent Settings → Tools → Video 並把該分組開啟。如果你的賬戶裡看不到這個分組,說明影片生成在你當前的環境中不可用——請聯絡你的管理員。
輸入引數
| 引數 | 必填 | 說明 |
|---|---|---|
prompt | 是 | 對影片的自然語言描述 |
file_path | 是 | 輸出路徑。相對路徑落到智慧體 Drive;/space/... 寫入空間 Drive |
attachments | 否 | 參考媒體陣列——每一項是一個 URL、資產 ID、Drive 路徑字串,或一個顯式物件 { path? / url?, type?, role?, name?, mimeType? } |
model | 否 | 覆蓋預設模型 |
durationSeconds | 否 | 4–15 秒 |
aspectRatio | 否 | adaptive / 21:9 / 16:9 / 4:3 / 1:1 / 3:4 / 9:16 |
resolution | 否 | 480p / 720p / 1080p(並非每個模型都支援 1080p) |
generateAudio | 否 | 預設開啟 |
watermark | 否 | 預設關閉 |
returnLastFrame | 否 | 索取最後一幀,以便銜接下一段片段 |
webSearch | 否 | 為純文本生影片的提示詞允許參考性的網路搜尋 |
attachments 中的 role 取值
| role | 媒體型別 | 典型用途 |
|---|---|---|
reference_image | 圖片 | 通用參考(風格、主體) |
first_frame | 圖片 | 影片的首幀 |
last_frame | 圖片 | 末幀——與 first_frame 搭配用於首末幀模式 |
reference_video | 影片 | 用於編輯 / 延展流程的參考片段 |
reference_audio | 音訊 | 用於配音或背景的參考音訊 |
如果你省略 role,系統會根據媒體型別選取一個合理的預設值。
輸出路徑
- 相對路徑(如
videos/demo.mp4)——寫入智慧體 Drive - 以
/space/開頭的絕對路徑——寫入空間 Drive - 缺失的副檔名會被規範化為
.mp4 - 聊天氣泡的影片卡片會直接從該路徑渲染預覽
能力矩陣
能力因模型檔位而異——根據你的需要挑選一個:
| 檔位 | 文生影片 | 首幀 | 首+末幀 | 多模態參考(圖/影片/音訊) | 編輯 | 延展 | 最高解析度 | 時長 |
|---|---|---|---|---|---|---|---|---|
| Flagship | ✓ | ✓ | ✓ | 完整 | ✓ | ✓ | 1080p | 4–15s |
| Flagship fast | ✓ | ✓ | ✓ | 完整 | ✓ | ✓ | 720p | 4–15s |
| Pro | ✓ | ✓ | ✓ | 僅圖片 | ✗ | ✗ | 1080p | 4–12s |
| Lite i2v | ✗ | ✓ | ✗ | 僅圖片 | ✗ | ✗ | 720p | 2–12s |
| Lite t2v | ✓ | ✗ | ✗ | ✗ | ✗ | ✗ | 720p | 2–12s |
當 generateAudio: true 時,Flagship 檔位可以輸出音訊。
媒體規格
圖片——jpeg / png / webp / bmp / tiff / gif / heic / heif。每張 ≤ 30 MB,寬高比 0.4–2.5,邊長 300–6000 px。數量:首幀 1 張,首+末幀 2 張,多模態參考 1–9 張,lite 參考 1–4 張。
影片——mp4 / mov,H.264 或 H.265 + AAC / MP3。每段 2–15 秒,最多 3 段,總計 ≤ 15 秒。480p / 720p / 1080p,24–60 fps。
音訊——wav / mp3,每段 2–15 秒,最多 3 段,總計 ≤ 15 秒,每段 ≤ 15 MB。
提示詞技巧
公式:主體 + 動作,場景 + 動作,鏡頭 + 動作。
- 具體一點。不要堆砌抽象的形容詞。
- 把重要的部分(主體、動作、鏡頭)放在前面。
- 先迭代提示詞,再加參考媒體;把模糊的措辭換成具體的描述。
- 文生影片方差很大——用它來試探創意;當你需要穩定的畫面時,改用圖生影片。
- 使用圖生影片時,上傳一張高質量的首幀;首幀質量對結果影響很大。
寬高比與裁剪
如果 aspectRatio 與輸入圖片不同,後端會沿較短的一邊進行居中裁剪,使裁剪區域完全落在原圖之內。把 aspectRatio 設得接近輸入圖片的比例,或使用 adaptive 讓後端自動匹配。
取消任務
排隊中或執行中的任務可以直接從訊息氣泡停止。狀態會立即翻轉為「cancelled」,後臺不再繼續任何工作。
限制
- 中間狀態和臨時影片 URL 會保留 24 小時然後被清理;已經寫入 Drive 的影片不受影響。
- 含有真實人臉的參考媒體會被拒絕。
- 按賬戶的 RPM 與併發限制適用;如果你觸發了速率限制,錯誤會顯示在訊息氣泡裡。
- 生成時間取決於時長、解析度和模型——通常為 30 秒到幾分鐘。關閉會話會暫停狀態更新;重新開啟會話會恢復更新。