Kling 的 O1 (Omni One) 在 beta/內部風格指南中被描述為一款 統一的多模態視頻基礎模型——一個單一系統,旨在通過一種交互語言同時處理 視頻生成 與 基於指令的視頻編輯。與其在不同工具間跳轉於“文本轉視頻”、“參考轉視頻”、“視頻編輯”及“鏡頭延伸”模式,O1 的核心理念是:給它文本 + 圖像 + 視頻參考 + 主體參考,像導演一樣在一個連續工作流程中迭代。
這一方向也與快手如何描述 Kling 圍繞 MVL (Multi-modal Visual Language) 的演變相契合:通過結合文本與視覺參考,表達身份、風格、場景、動作及攝影意圖。
Kling O1 (Omni One) 是什麼?通俗解釋
把 O1 想像成嘗試做一個 “創造+修訂”端到端 的單一模型:
- 從文本生成全新鏡頭
- 從參考(圖像/視頻)生成
- 從 首幀/尾幀 創建鏡頭
- 在視頻中 添加/移除 物件或人物
- 應用 變換(外觀變化,修改)
- 風格重繪(給片段換風格)
- 鏡頭延伸,延續動作及節奏
這些任務都列於指南內,歸納在單一統一模型下,而非分散的專用流程。
核心理念:MVL(多模態視覺語言)
O1 的指南將交互框架定義為:你的輸入不只是放入工作流程的“素材”,而是 指令。文本作為高層計劃;參考圖像/視頻提供視覺約束;主體參考錨定身份。
快手的 MVL 框架類似:它幫助用戶通過整合多模態信息如圖像參考和視頻剪輯,傳達多維度創意意圖——身份、外觀、風格、場景、動作、表情及攝影機運動。
實際上,O1 追求的是這樣的體驗:
“保持我主角的臉部一致,保持同一件夾克,現在移除旁觀者,切換到金色時光照明,鏡頭推進並延長鏡頭。”
…而非導出到編輯器,遮罩、關鍵幀製作及重新渲染。
O1 聲稱整合的功能(“全能能力堆疊”)
指南明確統一的範圍包括:
- text-to-video
- reference-to-video
- first/last-frame to video
- video add/remove
- video modification & transformation
- style repaint
- shot extension
將這些功能捆綁在一起意味著 O1 不僅是在比拼“首帧渲染多漂亮”,更是在意你是否能通過迭代編輯在模型內完成一個片段。
一句話編輯:將後製變成聊天
指南中對創作者最有意義的承諾之一是 單句編輯,即用自然語言直接對現有視頻提出如移除路人、變更時間、換裝/風格等請求。
如果實現,將改變內容創作的經濟學:
- 減少學習特定編輯器技巧的時間
- 增加在故事、節奏和構圖上的迭代時間
- 提升廣告 A/B 測試效率(從同一基礎片段產生多個變體)
O1 致力解決的最大難題:一致性
大多數 AI 視頻系統依然難以克服觀眾一眼察覺的問題:連貫性。
- 臉部微妙變化
- 商標扭曲
- 服裝顏色漂移
- 道具瞬移
- 背景建築變形
O1 指南特別強調對輸入的更強理解與 多視角主體創建(從多角度構建主體身份),以提升鏡頭間的一致性。
這也凸顯了“統一”為何重要:若生成與編輯共享對主體的內部表示,修改片段時就不必每次都“重塑角色身份”。
「技能組合」:一次通過疊加任務
一個細微但重要的點:指南強調可以 組合任務,例如同時執行主體添加與背景更換,或一邊從圖像參考生成,一邊重塑風格。
聽上去細微,但當你大量創作時意義重大。任務疊加可帶來:
- 減少“生成 → 導出 → 編輯 → 再導入”的跳轉
- 減少浪費於中間步驟的生成次數
- 每次迭代週期產生更多實用變體
未來重點觀察(產品方向)
指南提及新的“omni/new”創作工作流程路徑,暗示一個“omni”集中枢,將生成與編輯合二為一,而非分割成獨立模式。
MVL 框架同樣反映 Kling 更宏觀的發展方向:用多模態約束進行“導演式”控制,而非僅是輸入簡單提示。
Kling O1 最可能發揮價值的實際用例
1) 短篇敘事內容(多鏡頭連貫)
反覆出現的角色與連貫的序列最受益於主體錨定與鏡頭延伸。
2) 產品與品牌廣告(變體生成)
如果可以做出:“同一產品,新場景,不同光線,去除反光,加手持物”,即可從單一基礎片段產生多種廣告角度。
3) 社交媒體高產工作流
一個“主打片段”,接著出 10 個變體:不同風格、時間、背景、刪除文本、延長鏡頭節奏——全程無需完整編輯器流程。
4) 前期預視/分鏡
探索攝影機動作、氛圍、佈局和節奏,為最終序列決策做準備。
快速起步提示範本(MVL 友好)
A) 基線鏡頭(先鎖定身份)
用主體參考 + 文本:
- 場景、時間/光線、攝影構圖+運動、動作、氛圍
- 否定約束:臉部漂移、服裝顏色變化、標誌變形
B) 編輯通道(單句後期)
“移除X,改變Y,保持身份不變。”
C) 延長鏡頭(續動作)
“延長2-4秒,繼續動作,保持風格,動作流暢。”
這正契合 O1 期望統一的“指令 + 參考”行為模式。
現在就可在 Flux AI 試用 Kling 模型(推薦)
如果想在 O1 (Omni One) 方向逐步演進期間立即開始生成,可嘗試以下當前選項:























