技能與自動化

影片生成

用內建的 generate_video 工具把文本或參考媒體變成影片。

需要一段片段又不想離開聊天?吩咐智慧體,它就會為你渲染一段。內建的影片生成工具接收一段提示詞和可選的參考媒體(圖片 / 影片 / 音訊),在後臺渲染影片,並把它直接放到智慧體或空間 Drive(雲盤)中的某個路徑上——渲染期間你可以繼續工作。

空間的「應用與技能」檢視

工作方式速覽

  • **非同步。**呼叫會立即返回;影片渲染時你可以繼續聊天。
  • **寫入 Drive。**成功後影片會落到你選定的路徑上,訊息氣泡會顯示一張預覽卡片。
  • **可取消。**排隊中或執行中的任務可以從聊天介面停止。

啟用該工具

開啟 Agent Settings → Tools → Video 並把該分組開啟。如果你的賬戶裡看不到這個分組,說明影片生成在你當前的環境中不可用——請聯絡你的管理員。

輸入引數

引數必填說明
prompt對影片的自然語言描述
file_path輸出路徑。相對路徑落到智慧體 Drive;/space/... 寫入空間 Drive
attachments參考媒體陣列——每一項是一個 URL、資產 ID、Drive 路徑字串,或一個顯式物件 { path? / url?, type?, role?, name?, mimeType? }
model覆蓋預設模型
durationSeconds4–15 秒
aspectRatioadaptive / 21:9 / 16:9 / 4:3 / 1:1 / 3:4 / 9:16
resolution480p / 720p / 1080p(並非每個模型都支援 1080p)
generateAudio預設開啟
watermark預設關閉
returnLastFrame索取最後一幀,以便銜接下一段片段
webSearch為純文本生影片的提示詞允許參考性的網路搜尋

attachments 中的 role 取值

role媒體型別典型用途
reference_image圖片通用參考(風格、主體)
first_frame圖片影片的首幀
last_frame圖片末幀——與 first_frame 搭配用於首末幀模式
reference_video影片用於編輯 / 延展流程的參考片段
reference_audio音訊用於配音或背景的參考音訊

如果你省略 role,系統會根據媒體型別選取一個合理的預設值。

輸出路徑

  • 相對路徑(如 videos/demo.mp4)——寫入智慧體 Drive
  • /space/ 開頭的絕對路徑——寫入空間 Drive
  • 缺失的副檔名會被規範化為 .mp4
  • 聊天氣泡的影片卡片會直接從該路徑渲染預覽

能力矩陣

能力因模型檔位而異——根據你的需要挑選一個:

檔位文生影片首幀首+末幀多模態參考(圖/影片/音訊)編輯延展最高解析度時長
Flagship完整1080p4–15s
Flagship fast完整720p4–15s
Pro僅圖片1080p4–12s
Lite i2v僅圖片720p2–12s
Lite t2v720p2–12s

generateAudio: true 時,Flagship 檔位可以輸出音訊。

媒體規格

圖片——jpeg / png / webp / bmp / tiff / gif / heic / heif。每張 ≤ 30 MB,寬高比 0.4–2.5,邊長 300–6000 px。數量:首幀 1 張,首+末幀 2 張,多模態參考 1–9 張,lite 參考 1–4 張。

影片——mp4 / mov,H.264 或 H.265 + AAC / MP3。每段 2–15 秒,最多 3 段,總計 ≤ 15 秒。480p / 720p / 1080p,24–60 fps。

音訊——wav / mp3,每段 2–15 秒,最多 3 段,總計 ≤ 15 秒,每段 ≤ 15 MB。

提示詞技巧

公式:主體 + 動作,場景 + 動作,鏡頭 + 動作

  • 具體一點。不要堆砌抽象的形容詞。
  • 把重要的部分(主體、動作、鏡頭)放在前面。
  • 先迭代提示詞,再加參考媒體;把模糊的措辭換成具體的描述。
  • 文生影片方差很大——用它來試探創意;當你需要穩定的畫面時,改用圖生影片。
  • 使用圖生影片時,上傳一張高質量的首幀;首幀質量對結果影響很大。

寬高比與裁剪

如果 aspectRatio 與輸入圖片不同,後端會沿較短的一邊進行居中裁剪,使裁剪區域完全落在原圖之內。把 aspectRatio 設得接近輸入圖片的比例,或使用 adaptive 讓後端自動匹配。

取消任務

排隊中或執行中的任務可以直接從訊息氣泡停止。狀態會立即翻轉為「cancelled」,後臺不再繼續任何工作。

限制

  • 中間狀態和臨時影片 URL 會保留 24 小時然後被清理;已經寫入 Drive 的影片不受影響。
  • 含有真實人臉的參考媒體會被拒絕。
  • 按賬戶的 RPM 與併發限制適用;如果你觸發了速率限制,錯誤會顯示在訊息氣泡裡。
  • 生成時間取決於時長、解析度和模型——通常為 30 秒到幾分鐘。關閉會話會暫停狀態更新;重新開啟會話會恢復更新。

相關

On this page