Workflow,不是群聊
评审被设计成一次明确的任务:选择输入、选择目标 Agent、选择模板、得到结果,而不是开放式多人对话。
Agent Review / Design Notes
当前的 Agent 评审不是“让多个 Agent 聊起来”,而是把第二视角审查、上下文边界、人工审批和可审计记录组织成一个可收敛的本地 workflow。
评审被设计成一次明确的任务:选择输入、选择目标 Agent、选择模板、得到结果,而不是开放式多人对话。
第二个 Agent 的主要价值是找事实错误、边界条件、隐私风险和过度设计,而不是继续生成更多相似回复。
从最小的最近输出开始,只有在用户选择时才扩大到线程摘要或最近一轮对话。
评审结果不会自动写回原线程。用户先看见结果,再决定复制、修复或继续投递。
Agent Loop 调研给这个功能的启发,是把目标、工具、环境反馈、验证和记忆放进有限循环。Mission Control 只做本地 harness:路由消息、限制上下文、记录 job、展示结果、保留人工审批点。
从线程详情里选择一段可评审输出,而不是默认搬运完整历史。
latest-agent-signal、thread-summary、Codex latest-turn 分层选择。
Codex、Claude Code、OpenCode CLI 作为目标 Agent 运行模板化审查。
review job 保存状态、目标、模板、预览、结果、错误和调试摘要。
线程详情里只有“交给另一个 Agent 评审”的明确动作;MVP 不做群聊窗口。
避免多模型互相续写、目标漂移、用户不知道何时结束。
默认 input mode 是 latest-agent-signal,只发送当前预览里的最近 Agent 输出。
避免把完整本地 transcript、路径和私密上下文无意交给目标 CLI。
thread-summary 和 Codex latest-turn 是用户选择项,并在 UI 中给出隐私提示。
避免把摘要当成原始回复,也避免猜测 Claude/OpenCode 私有 cache。
review job 写入 ~/.agent-mission-control/reviews.jsonl,记录状态、源线程、目标、模板和截断结果。
避免后台 runner 失败后无从排查,也避免结果无限增长。
runner 调用本机 CLI;结果只存 Mission Control 自己的状态文件。
避免污染 Codex、Claude、OpenCode 原始会话或发布不可控外部动作。
完成后提供复制评审结果、复制修复 Prompt、复制调试摘要。
避免系统自动把审查意见写回源 Agent,造成错误修复或权限误用。
评审功能参考了“上下文是稀缺资源”的原则。默认只传最小片段;当用户真的需要更多背景,再选择更宽的输入模式。
只发送最近 Agent 输出信号;适合检查回复质量、明显漏洞和下一步建议。
发送标准线程字段、状态、token、最近用户/Agent 信号;适合技术方案或产品判断。
目前只对 Codex 开放,读取最近 user -> final answer 的稳定边界。
只有用户明确确认后才考虑,并需要预览、截断和审计。
完整上下文成本高、隐私面大,也容易让目标 Agent 评审对象变形。
Review job 是只读审查;任何写文件或修改生产数据的 loop 都要另立风险提示。
目标列表来自后端能力检测,CLI 不存在时显示不可用,不阻塞看板。
发布版本优先保留站内待处理中心,桌面提醒要等可靠原生路径。
Review Loop Today
Agent 评审功能参考的是“可收敛的 Agent Loop”理念:让另一个 Agent 成为审查者,而不是聊天者;让上下文、权限、记录和下一步动作都留在 Mission Control 的可见边界里。