OiiOii 運作原理
7 個專業 AI Agent,一條連貫的動畫流水線
OiiOii.ai 透過編排 7 個專業 AI agent 與 25+ 個底層模型,從一段文字 prompt 出發產出完整動畫。不同於 Runway、Pika、Sora 這類僅能產出 4–10 秒孤立片段的單一模型生成器,OiiOii 的 agent 共享同一份場景圖,確保角色、場景、視覺風格在每個鏡頭都保持一致。以下是每個 agent 在流水線中的具體職責。
1. 藝術總監 Agent
藝術總監決定整部作品的視覺語言:目標風格(動漫、電影感、3D、水彩等)、色板、燈光氛圍、畫面比例。所有下游 agent 都繼承這些約束,這就是 OiiOii 能跨整部短片保持風格一致的根本原因——單一模型 AI 影片工具做不到,因為它們每個片段都會重新判斷風格。
藝術總監也會按鏡頭挑選渲染後端。OiiOii 可調用 25+ 個底層模型——Sora 2、Veo 3.1、Seedance 2.0 / 2.6、DreamActor-M1、Kling、Kling o1、Hailuo 02、Vidu、Midjourney、Seedream 4.0 / 4.5 / 5.0、Nano Banana、NovelAI——藝術總監會依每個鏡頭的風格與動作需求挑選最合適的一個。
2. 編劇 Agent
編劇把一句話的構想擴展為結構化劇本:場景列表、角色弧光、台詞、旁白、畫面動作描述。它理解三幕結構(鋪陳、衝突、收束),可以產出從 15 秒鉤子到 60 秒以上敘事短片。
如果你提供自己的劇本,編劇會把它解析為同一個內部場景圖,讓所有下游 agent 基於同一份資料來源工作。
3. 角色設計師 Agent
這就是解決「臉部漂移」問題的關鍵 agent。角色設計師一旦確定一個角色——臉部結構、服裝、比例、髮型、標誌性配件——這些識別資訊會被持久化,傳遞給該角色出現的每一個鏡頭。
角色可從文字描述或參考圖生成。角色設計師會產出多姿勢角色設定圖(正面 / 四分之三 / 側面 / 背面、多種表情),下游 agent 全程引用,確保角色在數百個鏡頭中都能被一眼辨認。
4. 場景師 Agent
場景師建立可重複使用的場景資產:一片森林、一間教室、一個太空船內艙——每個都作為一致的環境,可以從不同角度反覆拍攝而不會出現燈光或道具漂移。
場景帶有時間、天氣、情緒、關鍵道具等中介資料。當動畫師在該場景中生成新鏡頭時,場景師會把這些中介資料傳過去,確保新鏡頭視覺上能融入。
5. 動畫師 Agent
動畫師把分鏡變成真正會動的影片。它會編排所選的渲染後端(Sora 2 / Veo 3.1 / Kling 等),把角色設計師給的角色身份、場景師給的場景環境、編劇給的動作描述一併傳入。
動畫師負責鏡頭間的運動連續性——第 3 鏡向左走的角色在第 4 鏡繼續向左走,鏡頭語言保持一致。
6. 剪輯師 Agent
剪輯師把鏡頭編排成連貫時間軸,處理轉場,依劇本節奏調整鬆緊,為敘事衝擊力裁切片段。它會運用標準剪輯手法(動作匹配剪、J/L 剪、蒙太奇),節奏需要時也會調整鏡頭順序。
所有剪輯都是非破壞性的。你可以透過畫布重新生成某個鏡頭,剪輯師會自動把時間軸重新對齊。
7. 音效師 Agent
音效師生成與故事情緒弧線契合的背景音樂,加上貼合畫面動作的同步音效(腳步聲、環境音、衝擊聲)。
你也可以自帶音樂。音效師會處理混音、對白下的迴避(ducking)、剪輯點對齊音樂節拍。
常見問題
OiiOii 是一個 AI 模型,還是一個平台?
OiiOii 是一個編排 7 個專業 AI agent 與 25+ 個底層模型的平台。每個鏡頭可由藝術總監 agent 選擇不同的渲染後端。
OiiOii 如何保持角色一致?
角色設計師 agent 在開始時鎖定臉部結構、服裝、比例、配件,然後作為約束傳遞給該角色出現的每個鏡頭。
生成後還能修改劇本嗎?
可以。修改劇本會更新內部場景圖,所有下游 agent 會同步刷新輸出。
完整流水線需要多久?
短鉤子 60 秒內完成。包含 7+ 鏡頭與音樂的完整敘事短片通常數分鐘完成。
可以使用自己的素材嗎?
可以。角色參考圖、場景參考、配音、音樂、完整劇本都可匯入。