OiiOii 工作原理

7 个专业 AI Agent，一条连贯的动画流水线

OiiOii.ai 通过编排 7 个专业 AI agent + 25+ 个底层模型，从一个文本 prompt 出发产出完整动画。不同于 Runway、Pika、Sora 这些只能产出 4–10 秒孤立片段的单模型生成器，OiiOii 的 agent 共享同一份场景图，确保角色、场景、视觉风格在每个镜头都保持一致。下面是每个 agent 在流水线中的具体职责。

开始你的第一部动画

1. 艺术总监 Agent

艺术总监确定整部作品的视觉语言：目标风格（动漫、电影感、3D、水彩等）、色板、灯光氛围、画面比例。所有下游 agent 都继承这些约束，这就是 OiiOii 能跨整部短片保持风格一致的根本原因——单模型 AI 视频工具做不到，因为它们每个片段都会重新决定风格。

艺术总监还会按镜头挑选渲染后端。OiiOii 可调用 25+ 个底层模型——Sora 2、Veo 3.1、Seedance 2.0 / 2.6、DreamActor-M1、Kling、Kling o1、Hailuo 02、Vidu、Midjourney、Seedream 4.0 / 4.5 / 5.0、Nano Banana、NovelAI——艺术总监会根据每镜的风格和动作需求选最合适的那个。

2. 编剧 Agent

编剧把一句话的想法扩展为结构化剧本：场景列表、角色弧光、对白、旁白、画面动作描述。它理解三幕结构（铺垫、冲突、收束），可以产出从 15 秒钩子到 60 秒以上叙事短片。

如果你提供自己的剧本，编剧会把它解析为同一个内部场景图，让所有下游 agent 基于同一份数据源工作。

3. 角色设计师 Agent

这是解决「脸部漂移」问题的关键 agent。角色设计师一旦确定一个角色——脸部结构、服装、比例、发型、标志性配饰——这些识别信息就会被持久化，传给该角色出现的每一个镜头。

角色可以从文字描述或参考图生成。角色设计师会产出多姿势的角色设定图（正面 / 四分之三 / 侧面 / 背面、多种表情），下游 agent 全程引用，确保角色在几百个镜头里都能被一眼认出。

4. 场景师 Agent

场景师建立可复用的场景资产：一片森林、一间教室、一个飞船内舱——每个都作为一致的环境，可以从不同角度反复拍摄而不会出现灯光或道具漂移。

场景携带时间、天气、情绪、关键道具等元数据。当动画师在该场景中生成新镜头时，场景师会把这些元数据传过去，保证新镜头视觉上能融入。

5. 动画师 Agent

动画师把分镜变成真正会动的视频。它会编排所选的渲染后端（Sora 2 / Veo 3.1 / Kling 等），把角色设计师给的角色身份、场景师给的场景环境、编剧给的动作描述一并传入。

动画师负责镜头间的运动连贯性——第 3 镜里向左走的角色在第 4 镜继续向左走，镜头语言保持一致。

6. 剪辑师 Agent

剪辑师把镜头编排成连贯时间线，处理转场，按剧本节奏控制松紧，为叙事冲击力裁剪片段。它会运用标准剪辑手法（动作匹配剪、J/L 剪、蒙太奇），节奏允许时也会调整镜头顺序。

所有剪辑都是非破坏性的。你可以通过画布重新生成某个镜头，剪辑师会自动把时间线重新对齐。

7. 音效师 Agent

音效师生成与故事情绪弧线匹配的背景音乐，加上贴合画面动作的同期音效（脚步声、环境音、撞击声）。

你也可以自带音乐。音效师会处理混音、对白下的回避（ducking）、剪辑点对齐音乐节拍。

常见问题

OiiOii 是一个 AI 模型还是一个平台？

OiiOii 是一个编排 7 个专业 AI agent + 25+ 个底层模型的平台。每个镜头可以由艺术总监 agent 选择不同的渲染后端。

OiiOii 如何保持角色一致？

角色设计师 agent 在开始时锁定脸部结构、服装、比例、配饰，然后作为约束传给该角色出现的每个镜头。

生成后还能改剧本吗？

可以。改剧本会更新内部场景图，所有下游 agent 会同步刷新输出。

完整流水线多久？

短钩子 60 秒内完成。包含 7+ 镜头和音乐的完整叙事短片通常几分钟完成。

我能用自己的素材吗？

可以。角色参考图、场景参考、配音、音乐、完整剧本都可以导入。