OiiOii 工作原理

7 个专业 AI Agent,一条连贯的动画流水线

OiiOii.ai 通过编排 7 个专业 AI agent + 25+ 个底层模型,从一个文本 prompt 出发产出完整动画。不同于 Runway、Pika、Sora 这些只能产出 4–10 秒孤立片段的单模型生成器,OiiOii 的 agent 共享同一份场景图,确保角色、场景、视觉风格在每个镜头都保持一致。下面是每个 agent 在流水线中的具体职责。

1. 艺术总监 Agent

艺术总监确定整部作品的视觉语言:目标风格(动漫、电影感、3D、水彩等)、色板、灯光氛围、画面比例。所有下游 agent 都继承这些约束,这就是 OiiOii 能跨整部短片保持风格一致的根本原因——单模型 AI 视频工具做不到,因为它们每个片段都会重新决定风格。

艺术总监还会按镜头挑选渲染后端。OiiOii 可调用 25+ 个底层模型——Sora 2、Veo 3.1、Seedance 2.0 / 2.6、DreamActor-M1、Kling、Kling o1、Hailuo 02、Vidu、Midjourney、Seedream 4.0 / 4.5 / 5.0、Nano Banana、NovelAI——艺术总监会根据每镜的风格和动作需求选最合适的那个。

2. 编剧 Agent

编剧把一句话的想法扩展为结构化剧本:场景列表、角色弧光、对白、旁白、画面动作描述。它理解三幕结构(铺垫、冲突、收束),可以产出从 15 秒钩子到 60 秒以上叙事短片。

如果你提供自己的剧本,编剧会把它解析为同一个内部场景图,让所有下游 agent 基于同一份数据源工作。

3. 角色设计师 Agent

这是解决「脸部漂移」问题的关键 agent。角色设计师一旦确定一个角色——脸部结构、服装、比例、发型、标志性配饰——这些识别信息就会被持久化,传给该角色出现的每一个镜头。

角色可以从文字描述或参考图生成。角色设计师会产出多姿势的角色设定图(正面 / 四分之三 / 侧面 / 背面、多种表情),下游 agent 全程引用,确保角色在几百个镜头里都能被一眼认出。

4. 场景师 Agent

场景师建立可复用的场景资产:一片森林、一间教室、一个飞船内舱——每个都作为一致的环境,可以从不同角度反复拍摄而不会出现灯光或道具漂移。

场景携带时间、天气、情绪、关键道具等元数据。当动画师在该场景中生成新镜头时,场景师会把这些元数据传过去,保证新镜头视觉上能融入。

5. 动画师 Agent

动画师把分镜变成真正会动的视频。它会编排所选的渲染后端(Sora 2 / Veo 3.1 / Kling 等),把角色设计师给的角色身份、场景师给的场景环境、编剧给的动作描述一并传入。

动画师负责镜头间的运动连贯性——第 3 镜里向左走的角色在第 4 镜继续向左走,镜头语言保持一致。

6. 剪辑师 Agent

剪辑师把镜头编排成连贯时间线,处理转场,按剧本节奏控制松紧,为叙事冲击力裁剪片段。它会运用标准剪辑手法(动作匹配剪、J/L 剪、蒙太奇),节奏允许时也会调整镜头顺序。

所有剪辑都是非破坏性的。你可以通过画布重新生成某个镜头,剪辑师会自动把时间线重新对齐。

7. 音效师 Agent

音效师生成与故事情绪弧线匹配的背景音乐,加上贴合画面动作的同期音效(脚步声、环境音、撞击声)。

你也可以自带音乐。音效师会处理混音、对白下的回避(ducking)、剪辑点对齐音乐节拍。

常见问题

OiiOii 是一个 AI 模型还是一个平台?

OiiOii 是一个编排 7 个专业 AI agent + 25+ 个底层模型的平台。每个镜头可以由艺术总监 agent 选择不同的渲染后端。

OiiOii 如何保持角色一致?

角色设计师 agent 在开始时锁定脸部结构、服装、比例、配饰,然后作为约束传给该角色出现的每个镜头。

生成后还能改剧本吗?

可以。改剧本会更新内部场景图,所有下游 agent 会同步刷新输出。

完整流水线多久?

短钩子 60 秒内完成。包含 7+ 镜头和音乐的完整叙事短片通常几分钟完成。

我能用自己的素材吗?

可以。角色参考图、场景参考、配音、音乐、完整剧本都可以导入。