Generation Workspace

生成准备架构

定位

Jellyfish 当前已经将多条生成链逐步收敛到统一的“生成准备”模型，用于解决以下问题：

基础真值与最终提交内容混用
预览与提交使用的上下文不一致
页面内部状态散落，stale / loading / submit 语义混乱

当前已接入该架构的链路包括：

分镜帧图片生成
视频提示词预览与提交
资产图片生成（角色 / 演员 / 场景 / 道具 / 服装）

统一模型

当前统一使用 4 层结构：

Base Draft
- 可持久化、可编辑的业务真值
Context
- 本次生成依赖的动态上下文
Derived Preview
- 基于 Base Draft + Context 推导出的预览结果
Submission Payload
- 最终提交给模型的运行载荷

后端当前结构

当前统一服务目录位于：

backend/app/services/studio/generation/
├── shared/
├── frame/
├── video/
└── asset_image/

`shared`

负责放置生成准备的共享类型：

GenerationBaseDraft
GenerationContext
GenerationDerivedPreview
GenerationSubmissionPayload

`frame`

当前关键帧图片链已经按以下职责拆分：

build_base
build_context
derive_preview
build_submission

当前 API 仍保持原路径不变，但内部已经开始调用这一层服务。

`video`

当前视频链已经开始使用同样的四段式结构：

build_base
build_context
derive_preview
build_submission

当前 preview-prompt 与 create video task 已共享同一份 reference_mode + images 上下文。其中工作室当前使用的 film/tasks/video/preview-prompt 也会返回完整 pack：

previous_shot_summary
next_shot_goal
continuity_guidance
composition_anchor
screen_direction_guidance
action_beats
action_beat_phases

因此工作室视频提示词预览与 studio 侧底层 pack 现在保持同源，不再出现“提示词有值但连续性上下文始终为空”的接口分叉。

当前视频参数已收口为以 ratio 为唯一业务主参数：

项目级默认：Project.default_video_ratio
分镜级覆盖：ShotDetail.override_video_ratio
前端在提交视频任务时显式传入本次生效的 ratio
后端直接使用请求中的 ratio 创建任务
若某个供应商不直接支持 ratio，由 provider adapter 在执行层内部派生辅助 size
前端比例枚举来自当前默认视频模型 capability 动态返回，不再使用静态常量
关键帧图片若用于视频参考，提交时会显式携带 target_ratio + resolution_profile
后端根据当前默认图片模型 capability 解析对应 size，保证关键帧画幅与目标视频保持一致
工作室会展示当前关键帧规格预览：ratio + resolution_profile -> size
视频提示词预览当前会额外暴露 action_beats / previous_shot_summary / next_shot_goal / continuity_guidance
视频提示词预览当前会额外暴露 composition_anchor
视频提示词预览当前会额外暴露 screen_direction_guidance
action_beats 由当前镜头剧本摘录、镜头描述与对白规则化提炼，用于降低“像静态画面说明”的问题
continuity 字段由相邻镜头摘要生成，用于降低镜头切换时的突兀感
composition_anchor 由景别、运镜、主场景、主角色与相邻镜头关系规则化生成，用于降低构图和轴线突变
screen_direction_guidance 由机位角度、对白关系、相邻镜头场景连续性规则化生成，用于降低人物翻面与反打跳轴
若视频模板未显式消费这些 guidance，系统会在模板渲染结果后自动补一段稳定的“镜头执行约束”，避免新字段只存在于 preview pack 中
即便视频走手动 prompt 分支，系统当前也会追加同一层 guidance 补强，避免手动文本完全绕过镜头连续性与构图约束
分镜帧 frame-render-prompt 当前也会把 director_command_summary 与必要的 continuity_guidance 轻量补入最终图片提示词
分镜帧 frame-render-prompt 当前也会把必要的 frame_specific_guidance 作为“当前帧职责”候选补入最终图片提示词
分镜帧 frame-render-prompt 当前也会把 composition_anchor 轻量补入最终图片提示词
分镜帧 frame-render-prompt 当前也会把 screen_direction_guidance 轻量补入最终图片提示词
- 因此关键帧提示词预览中看到的高优先级导演约束，不再只停留在调试展示
- 最终提交给图片模型的 render prompt 会显式带上这层收敛后的约束、当前帧职责、构图重心与朝向/视线要求
对于首帧，当前系统会优先强调“触发瞬间 / 初始反应 / 未完成态”表达，避免提示词直接落到后续完成动作或最终姿态
为避免 prompt 膨胀，这层收敛当前最多只保留 3 条 guidance
当前默认优先级为：director_command_summary > continuity_guidance > screen_direction_guidance > composition_anchor
这层优先级还会按 frame_type 做动态微调：
- first 更偏向保留 composition_anchor
- key / last 更偏向保留 screen_direction_guidance
- 目的是让建立镜头先稳住空间，对峙/反打/收束镜头先稳住视线与左右轴线
前端关键帧提示词预览当前会直接展示：
- “基础提示词生成依据”，用于说明 guidance 主要先服务于上游基础提示词生成
- “最终图片提示词收敛结果”，用于说明只有少量 guidance 会被再次补进最终图片 prompt
- 最终 render prompt 实际保留了哪些 guidance
- 哪些 guidance 因压缩策略被舍弃
- 每条 guidance 被保留或压缩的原因说明
- 同时提供更短的 reason_tag，例如 首帧保空间、关键帧保轴线
- 这样可以直接解释“为什么预览里有 4 条规则，但最终 prompt 只用了 3 条”
图片任务提交后，render_context 当前也会保留这组 guidance 决策详情
- 因此任务链与预览链现在共享同一份“保留 / 压缩 / 原因”上下文
项目级信息提取当前还会输出镜头语言默认建议
- semantic_suggestion.camera_shot
- semantic_suggestion.angle
- semantic_suggestion.movement
- semantic_suggestion.duration
- semantic_suggestion.action_beats
extract / extract-async 在同步资产候选与对白候选之外，会按镜头序号将上述默认建议回写到 ShotDetail
- 因此 camera_shot / angle / movement / duration 不再只依赖分镜写库时的硬编码初始值
- action_beats 也会作为镜头动作拍点真值回写到 ShotDetail
- 工作室中的镜头语言微调，修改的也是这同一份 ShotDetail 真值
分镜准备页聚合状态当前也会显式返回：
- basic_info_ready
- semantic_defaults_ready
- action_beats_ready
- action_beats_count
- action_beat_phases
- ready_for_generation
- 其中 ready_for_generation 表示“准备页视角下可进入生成”，不等同于单纯的 shot.status = ready
视频链当前会优先消费 ShotDetail.action_beats
- 只有在镜头尚未确认动作拍点时，才回退到基于 script_excerpt + description + dialogue 的规则化提炼
关键帧链当前也会优先消费 ShotDetail.action_beats
- 后端会先对动作拍点做一层轻量 trigger / peak / aftermath 推断
- 首帧优先消费触发阶段拍点
- 关键帧优先消费峰值阶段拍点
- 尾帧优先消费收束阶段拍点
视频 prompt 预览当前也会直接暴露这层阶段推断结果
- 因此视频链与关键帧链现在会用同一套 trigger / peak / aftermath 标签来展示镜头内部动作过程

`asset_image`

当前资产图片生成已开始迁移到：

build_base
build_context
derive_preview
build_submission

当前 actor / character / scene / prop / costume 图片的 render / submit 已开始走这套结构。

底层渲染组件约定

当前旧的图片兼容层已经移除，新的生成准备编排统一以以下目录为主入口：

generation/frame
generation/video
generation/asset_image

其中仅保留 shot_video_prompt_pack 作为视频 pack 与模板渲染的底层组件：

它负责构建 ShotVideoPromptPackRead
它负责模板渲染所需的底层函数
它不再承担视频预览 / 提交的主编排入口职责

前端当前结构

`useGenerationDraft`

当前前端已提供统一 hook：

front/src/pages/aiStudio/hooks/useGenerationDraft.ts

该 hook 统一管理：

base
context
derived
state
deriveNow
submitNow
hydrate
resetDerived

当前已接入页面

分镜工作室

ChapterStudio 当前已开始将：

关键帧提示词预览
视频提示词预览

接入 useGenerationDraft，逐步统一为：

用户编辑 base
页面维护 context
系统展示 derived
提交前通过 submitNow() 自动确保 derived 为最新结果

当前关键帧图片生成与视频生成都已经接入这套提交语义：

若基础提示词或上下文已变化，会先重新 derive
再使用最新的 derived 结果提交任务
页面不再单独维护一套“提交前再手动 render”的旁路逻辑

资产编辑页

AssetEditPageBase 当前已开始将资产图片提示词预览与提交接入 useGenerationDraft。

因此，角色、演员、场景、道具、服装等资产编辑入口，已共享同一套生成准备心智模型。

其中，角色详情页也已收口到与演员 / 场景 / 道具 / 服装相同的资产编辑入口模型，不再单独维护一套角色图片生成入口逻辑。

当前资产图片生成提交也已统一为：

页面维护 base + context
submitNow() 在提交前自动保证 derived 最新
任务创建使用最新的 derived.prompt + derived.images
调试信息默认收起，仅在用户主动展开时展示上下文与质量校验细节

当前边界

任务中心

任务中心保持“通用、轻量”的原则：

展示任务状态、进度、成功失败、取消与回跳入口
不承载业务级上下文摘要
不承载提示词调试详情

不属于该架构的模块

以下模块当前不属于“生成准备架构”：

脚本处理类任务
分镜编辑页的信息提取确认流
任务中心

这些模块有独立职责，不参与当前的 Base Draft / Context / Derived Preview / Submission Payload 收敛。

LLM 默认模型解析