Kling O1 (Omni One):一款「統一」的多模態視頻模型,旨在取代你整個視頻堆疊

Kling O1 (Omni One) 旨在通過 MVL 將視頻生成與編輯統一——文字、圖像和視頻參考在一個無縫工作流程中協同運作。

Kling O1 (Omni One):一款「統一」的多模態視頻模型,旨在取代你整個視頻堆疊
日期: 2025-11-27

Kling 的 O1 (Omni One) 在 beta/內部風格指南中被描述為一款 統一的多模態視頻基礎模型——一個單一系統,旨在通過一種交互語言同時處理 視頻生成基於指令的視頻編輯。與其在不同工具間跳轉於“文本轉視頻”、“參考轉視頻”、“視頻編輯”及“鏡頭延伸”模式,O1 的核心理念是:給它文本 + 圖像 + 視頻參考 + 主體參考,像導演一樣在一個連續工作流程中迭代。

這一方向也與快手如何描述 Kling 圍繞 MVL (Multi-modal Visual Language) 的演變相契合:通過結合文本與視覺參考,表達身份、風格、場景、動作及攝影意圖。


Kling O1 (Omni One) 是什麼?通俗解釋

把 O1 想像成嘗試做一個 “創造+修訂”端到端 的單一模型:

  • 從文本生成全新鏡頭
  • 從參考(圖像/視頻)生成
  • 首幀/尾幀 創建鏡頭
  • 在視頻中 添加/移除 物件或人物
  • 應用 變換(外觀變化,修改)
  • 風格重繪(給片段換風格)
  • 鏡頭延伸,延續動作及節奏

這些任務都列於指南內,歸納在單一統一模型下,而非分散的專用流程。


核心理念:MVL(多模態視覺語言)

O1 的指南將交互框架定義為:你的輸入不只是放入工作流程的“素材”,而是 指令。文本作為高層計劃;參考圖像/視頻提供視覺約束;主體參考錨定身份。

快手的 MVL 框架類似:它幫助用戶通過整合多模態信息如圖像參考和視頻剪輯,傳達多維度創意意圖——身份、外觀、風格、場景、動作、表情及攝影機運動。

實際上,O1 追求的是這樣的體驗:

“保持我主角的臉部一致,保持同一件夾克,現在移除旁觀者,切換到金色時光照明,鏡頭推進並延長鏡頭。”

…而非導出到編輯器,遮罩、關鍵幀製作及重新渲染。


O1 聲稱整合的功能(“全能能力堆疊”)

指南明確統一的範圍包括:

  • text-to-video
  • reference-to-video
  • first/last-frame to video
  • video add/remove
  • video modification & transformation
  • style repaint
  • shot extension

將這些功能捆綁在一起意味著 O1 不僅是在比拼“首帧渲染多漂亮”,更是在意你是否能通過迭代編輯在模型內完成一個片段。


一句話編輯:將後製變成聊天

指南中對創作者最有意義的承諾之一是 單句編輯,即用自然語言直接對現有視頻提出如移除路人、變更時間、換裝/風格等請求。

如果實現,將改變內容創作的經濟學:

  • 減少學習特定編輯器技巧的時間
  • 增加在故事、節奏和構圖上的迭代時間
  • 提升廣告 A/B 測試效率(從同一基礎片段產生多個變體)

O1 致力解決的最大難題:一致性

大多數 AI 視頻系統依然難以克服觀眾一眼察覺的問題:連貫性

  • 臉部微妙變化
  • 商標扭曲
  • 服裝顏色漂移
  • 道具瞬移
  • 背景建築變形

O1 指南特別強調對輸入的更強理解與 多視角主體創建(從多角度構建主體身份),以提升鏡頭間的一致性。

這也凸顯了“統一”為何重要:若生成與編輯共享對主體的內部表示,修改片段時就不必每次都“重塑角色身份”。


「技能組合」:一次通過疊加任務

一個細微但重要的點:指南強調可以 組合任務,例如同時執行主體添加與背景更換,或一邊從圖像參考生成,一邊重塑風格。

聽上去細微,但當你大量創作時意義重大。任務疊加可帶來:

  • 減少“生成 → 導出 → 編輯 → 再導入”的跳轉
  • 減少浪費於中間步驟的生成次數
  • 每次迭代週期產生更多實用變體

未來重點觀察(產品方向)

指南提及新的“omni/new”創作工作流程路徑,暗示一個“omni”集中枢,將生成與編輯合二為一,而非分割成獨立模式。

MVL 框架同樣反映 Kling 更宏觀的發展方向:用多模態約束進行“導演式”控制,而非僅是輸入簡單提示。


Kling O1 最可能發揮價值的實際用例

1) 短篇敘事內容(多鏡頭連貫)

反覆出現的角色與連貫的序列最受益於主體錨定與鏡頭延伸。

2) 產品與品牌廣告(變體生成)

如果可以做出:“同一產品,新場景,不同光線,去除反光,加手持物”,即可從單一基礎片段產生多種廣告角度。

3) 社交媒體高產工作流

一個“主打片段”,接著出 10 個變體:不同風格、時間、背景、刪除文本、延長鏡頭節奏——全程無需完整編輯器流程。

4) 前期預視/分鏡

探索攝影機動作、氛圍、佈局和節奏,為最終序列決策做準備。


快速起步提示範本(MVL 友好)

A) 基線鏡頭(先鎖定身份)

用主體參考 + 文本:

  • 場景、時間/光線、攝影構圖+運動、動作、氛圍
  • 否定約束:臉部漂移、服裝顏色變化、標誌變形

B) 編輯通道(單句後期)

“移除X,改變Y,保持身份不變。”

C) 延長鏡頭(續動作)

“延長2-4秒,繼續動作,保持風格,動作流暢。”

這正契合 O1 期望統一的“指令 + 參考”行為模式。


現在就可在 Flux AI 試用 Kling 模型(推薦)

如果想在 O1 (Omni One) 方向逐步演進期間立即開始生成,可嘗試以下當前選項:

Android 和 iOS 版 Flux AI 手機應用

立即下載 Flux AI 手機應用,使用 Flux AI 強大的工具—激發你的創造力,將文字轉化為令人驚嘆的視覺效果!

在網頁應用開始使用
flux-ai-app-download

Flux AI 進階圖片與影片 AI 工具

使用 Flux AI 強大的工具創作驚豔圖片與吸睛影片。發揮您的創意,體驗我們先進的 AI 科技。

Flux 圖片 AI 工具

利用 Flux AI 的文字轉圖與圖轉圖技術,立即生成驚豔圖片。

Flux AI 圖片生成器

Flux 影片 AI 工具

利用 Flux AI 的文字轉影片與圖轉影片技術,創造魔幻動畫影片。

Flux AI 影片生成器

Flux Kontext

使用 Flux AI 強大的工具創作驚豔圖片與吸睛影片。發揮您的創意,體驗我們先進的 AI 科技。

Flux AI 圖片生成器

Android 和 iOS 版 Flux AI 手機應用

立即下載 Flux AI 手機應用,使用 Flux AI 強大的工具—激發你的創造力,將文字轉化為令人驚嘆的視覺效果!

在網頁應用開始使用
flux-ai-app-download

立即開始使用 Flux AI 創作

現在免費試用 Flux AI。