Agent Mission Control 控制台界面截图

Agent Review / Design Notes

评审功能参考的设计理念

当前的 Agent 评审不是“让多个 Agent 聊起来”,而是把第二视角审查、上下文边界、人工审批和可审计记录组织成一个可收敛的本地 workflow。

默认输入 最近 Agent 输出信号
核心动作 Review -> Fix Prompt
安全边界 本地 CLI + 不写第三方状态
01

Workflow,不是群聊

评审被设计成一次明确的任务:选择输入、选择目标 Agent、选择模板、得到结果,而不是开放式多人对话。

02

额度花在验证

第二个 Agent 的主要价值是找事实错误、边界条件、隐私风险和过度设计,而不是继续生成更多相似回复。

03

上下文有阶梯

从最小的最近输出开始,只有在用户选择时才扩大到线程摘要或最近一轮对话。

04

关键门口留给人

评审结果不会自动写回原线程。用户先看见结果,再决定复制、修复或继续投递。

Closed Loop

从“多 Agent 互相回复”转成“可结束的评审闭环”

Agent Loop 调研给这个功能的启发,是把目标、工具、环境反馈、验证和记忆放进有限循环。Mission Control 只做本地 harness:路由消息、限制上下文、记录 job、展示结果、保留人工审批点。

A

源 Agent 产出

从线程详情里选择一段可评审输出,而不是默认搬运完整历史。

B

输入边界

latest-agent-signal、thread-summary、Codex latest-turn 分层选择。

C

独立评审

Codex、Claude Code、OpenCode CLI 作为目标 Agent 运行模板化审查。

D

结果沉淀

review job 保存状态、目标、模板、预览、结果、错误和调试摘要。

Design Mapping

理念如何落到当前功能里

设计理念 当前实现 避免的问题

做 workflow,不做无边界聊天室

线程详情里只有“交给另一个 Agent 评审”的明确动作;MVP 不做群聊窗口。

避免多模型互相续写、目标漂移、用户不知道何时结束。

默认最小上下文

默认 input mode 是 latest-agent-signal,只发送当前预览里的最近 Agent 输出。

避免把完整本地 transcript、路径和私密上下文无意交给目标 CLI。

上下文扩大要显式

thread-summary 和 Codex latest-turn 是用户选择项,并在 UI 中给出隐私提示。

避免把摘要当成原始回复,也避免猜测 Claude/OpenCode 私有 cache。

可审计记录

review job 写入 ~/.agent-mission-control/reviews.jsonl,记录状态、源线程、目标、模板和截断结果。

避免后台 runner 失败后无从排查,也避免结果无限增长。

本地优先,不写第三方状态

runner 调用本机 CLI;结果只存 Mission Control 自己的状态文件。

避免污染 Codex、Claude、OpenCode 原始会话或发布不可控外部动作。

人类保留最终门控

完成后提供复制评审结果、复制修复 Prompt、复制调试摘要。

避免系统自动把审查意见写回源 Agent,造成错误修复或权限误用。

Context Budget

上下文被设计成一组越来越宽的闸门

评审功能参考了“上下文是稀缺资源”的原则。默认只传最小片段;当用户真的需要更多背景,再选择更宽的输入模式。

  1. 默认 latest-agent-signal

    只发送最近 Agent 输出信号;适合检查回复质量、明显漏洞和下一步建议。

  2. 扩展 thread-summary

    发送标准线程字段、状态、token、最近用户/Agent 信号;适合技术方案或产品判断。

  3. 更宽 latest-turn

    目前只对 Codex 开放,读取最近 user -> final answer 的稳定边界。

  4. 未来 explicit full context

    只有用户明确确认后才考虑,并需要预览、截断和审计。

Product Boundaries

有意不做的事,同样是设计的一部分

不默认读取完整线程

完整上下文成本高、隐私面大,也容易让目标 Agent 评审对象变形。

不把评审等同修复

Review job 是只读审查;任何写文件或修改生产数据的 loop 都要另立风险提示。

不硬编码目标 Agent

目标列表来自后端能力检测,CLI 不存在时显示不可用,不阻塞看板。

不依赖系统通知

发布版本优先保留站内待处理中心,桌面提醒要等可靠原生路径。

Review Loop Today

一句话总结

Agent 评审功能参考的是“可收敛的 Agent Loop”理念:让另一个 Agent 成为审查者,而不是聊天者;让上下文、权限、记录和下一步动作都留在 Mission Control 的可见边界里。