协作观测框架 · Revised 2026-05-15

§ 00 — Preface

一段不替代评估的观察

它不告诉用户「你是谁」，也不告诉团队「这个人能力如何」。它只显化已经发生过的、可被追溯到证据的事件。

这个框架建立在 Work Memory 之上，不替代它。Work Memory 负责记录工作事实和思考证据；协作观测层负责在这些证据里显化人的方向性输入：用户在哪里改变了 AI 的默认走向，这个改变后来怎样了。

它是一面镜子，不是判官。镜子只显影，不下判决。

用户在哪里改变了 AI 的默认走向？这个改变后来怎样了？两个核心问题 · 全篇围绕

§ 01 — Position

一句话定位

这个框架只观察两件事：

人是否在协作中注入负熵。
这种注入是否在更长时间尺度上呈现可学习的结构。

它不是评估系统。所有用户面输出必须能追溯到 source refs：session id、canonical entry、commit、PR、spec。无 source 不发言。

1.1术语

W · plausible space: 当前可被 AI 生成并讲得通的叙述空间。系统每多给一个解释、画像、标签，W 就在扩大。

plausible: 不是「真实」或「被承诺过」，而是「能自洽、听起来合理、可被 AI 继续论证」。

梯度 · gradient: 用户通过行动留下的方向性痕迹：拒绝、约束、承担代价、维持选择。不是人格，不是综合解释。

baseline · 两层参照系: 判断「非默认」时所比较的预测分布。Phase 1 单点检测用 AI 当前的提议 / salience event；§9 长期可预测性才用 trajectory prior。— 2026-05-15 经实验拆分

valence: 正负价值判断。「有梯度」≠「正确／优秀」。框架剥离 valence。

source refs: 支撑某个观察的原始证据引用。任何用户面陈述必须可追溯回去。

empty-state: 未识别到事件时的输出。它不是空白，是对「没观察到什么、同时观察到什么」的明确陈述。

§ 02 — Premise

核心前提：plausible 坍塌

当前 Agent 在很多场景下会输出 plausible-but-flat 的分布——它能把 A 讲得合理，也能把非 A 讲得合理。

只要用户不施加方向性约束，决策方向就容易变成 AI 在 plausible 选项池里的采样结果。这就是「先验坍塌」：输出看起来丰富，实际方向性很弱。

在这个前提下，人的非默认动作才有观测价值。用户拒绝、约束、改道、承担代价，这些行为不是又一个 plausible 叙述，而是在压缩可能性空间。

如果未来 Agent 不再坍塌、或采样已稳定携带方向，这层框架的意义需要被重新定义。这不是永久真理，只是当前产品阶段的工作假设。

§ 03 — Refusal

为什么不能做评估系统

把对话提炼为「探索型 / 架构思维 / 协作能力 8 分」看起来很产品化，但它在结构上是错的。

原因不是「标签不礼貌」，而是它增加 W：把本应被用户行动压缩的可能性空间，重新扩张成更多可被讲通的身份解释。AI 已经能为他生成一百个听起来都对的解释；再加一个「数据驱动」的画像，本质上是在 plausible 池里再加一个更有权威感的选项。

本框架的判别标准只有一句：

它是在增加 W，还是在显化已有梯度？唯一判别 · 应贴在每个用户面输出旁

Fig. 01左侧是 W 的扩张：每多一个 plausible 解释、画像或分数，可被讲通的叙述空间就再加一。右侧是梯度的显化：用户已经做过的取舍被照亮，本来被讲通的路径反而消失。

§ 04 — Philosophy

设计哲学（三条）

4.1镜子，不是判官

用户面输出必须停留在观察陈述层。

可以这样说

我给出过直接实现方案，你没有继续推进它，而是要求先理解原代码的不变量。后续三次类似情境里，你也做了同样的选择。

不能这样说

你是谨慎型工程师。

前者是事件，用户可以继承、修正或否认。后者是身份命题，会被内化、反弹，并改变它所测量的对象。

4.2痕迹考古，不是身份综合

真正有信号的不是「偏好分布」——偏好太容易被 AI 模仿和包装。真正可观察的是承诺痕迹：用户在哪里放弃其他路径、拒绝更快方案、增加自己的工作量、在没有充分证据时做了方向明确的选择、后来承认「那次是错的」。

痕迹考古的目标不是推断人格，而是把已经发生过的负熵输入重新变得可见。

4.3分析单位是协作，不是用户

同一个用户，跟另一个 Agent、做另一个项目、处在另一个组织压力里，可能呈现完全不同的模式。所以本框架只描述：

某个用户、与某个 Agent、在某个项目上的协作状态。分析单位 · 不是「这个人本质上是什么样」

这条边界对任何按 User ID + Project ID 聚合长期记忆的系统都尤其重要——若不锁定「协作」为分析单位，系统很容易滑向个人评分和组织管理画像。

§ 05 — Two questions · Four stances

核心观察

5.1当下是否有负熵注入？

不是用户发言越多越好——大量指令也可能只是把 AI 的 plausible 生成继续推下去。真正有信号的是非默认动作：用户压缩了选择空间，承担了代价，并让后续工作沿着这个方向展开。

5.2长期是否结构化？

单点惊讶只说明某一刻用户做了非默认动作。结构化观察的是：这些非默认动作是否可以被学习。如果系统对「用户何时何处会这样做」的预测残差长期下降，说明这种负熵注入呈现结构。

残差长期不下降，本身也是一个信号。它不说明用户差，只说明这段协作关系里，人的方向性输入暂时没有形成稳定模式，或系统尚未学到。

5.3在 AI 显式分叉处的用户姿态（四分类）

2026 · 05 · 15 · 经实验修订

原版本按「用户对熵的贡献方向」切成「负熵 / 零 / 正熵」三类。「正熵贡献」那一类被自己的实验证伪——熵增是 AI 默认就在生成、用户至多是不阻止；把 agency 立在用户身上扭曲了 §3 的核心姿态。修订后的轴是在 AI 自己暴露的决策点处，用户的响应姿态，不再用「用户对熵的贡献」做切分轴。

在一个 AI 显式暴露的决策点上（直接提问、列 ≥2 个命名选项、表达 uncertainty），用户的响应姿态分四类——事件，不是用户类型：

engaged — 挑了选项、为某个选项实质论证、或对 framing 做 constructive critique。
deferred — 主动授权 agent 决定（「你来决定」/「看你」/「anything is fine」）。
overrode — 完全 reject 当前 framing，把方向拉到一个不同关切。
ignored — 换话题，没承认问题存在。

为什么 anchor 必须出自 AI 的 salience event：没有 anchor 时，沉默的授权熵泵与用户从来没碰上一个值得表态的分叉在行为上无法区分。anchor 让 stance 变得可比、可分类、可追溯。

退化的纯沉默场景（agent 没问、用户也没拦）属于另一类机制（silent stretches）的观察范围，不在这一节内。

同一用户、不同协作关系——分布显著不同。 2026-05-15 跨项目实验 · §4.3「分析单位是协作」的 numerical 证据

Fig. 02四类都是事件，不是用户类型。底部分布带是 2026-05-15 跨项目实验的 numerical 证据：同一用户在两段不同协作里分布显著不同——7 / 1 / 4 / 5 vs 6 / 0 / 9 / 0——正是 §4.3「分析单位是协作而不是用户」的实证侧面。

§ 06 — Internal mechanism

梯度点 · gradient point

「梯度点」是内部工程术语，不进入用户面 UI。用户面只展示事件本身。

内部定义：

AI 预测路径与用户实际输入之间的 divergence 达到阈值，且满足代价与持续性条件的事件。梯度点 · 内部定义

6.1为什么用惊讶度

信息论里，自信息是 I(x) = −log P(x)。事件概率越低，信息量越大。「惊讶」不是修辞，它就是信息量。这件事的关键不是让 AI 评价用户，而是反过来利用 AI 的预测能力定位它自己触及不到的东西。

系统的发言主语

「我在这里没有预测到你会这样做。」
而不是「我判断你很有洞察力。」

6.2两层 baseline · AI-proposal vs trajectory prior

2026 · 05 · 15 · 经实验修订

原版本把 trajectory prior 列为唯一可接受的 baseline。Phase 1 实验显示单点事件检测这一层用不到 trajectory prior——strict 负空间扫描和 salience-anchored deferral 两条 lens 都以 AI 当前提议作 baseline，稳定产出 source-anchored 事件、没退化成「用户风格分析」。但 trajectory prior 在 §9 二阶可预测性那一层仍然不可替代。

单点检测（Phase 1）：以 AI 当前输出作为 baseline。「用户没接住 AI 的具体提议」（§7）/「用户在 AI 的 flagged junction 上选择 deferral」（§5.3）都是相对 AI 当下输出可观察的，不需要 per-user 概率模型。这一层产 §5.3 的四类姿态事件 + §7 的负空间事件。

长期结构化（§9 二阶可预测性）：以 trajectory prior 作为 baseline。要测「用户的非默认动作是否可学习」，参照系必须是用户在这段协作里自己的演化路径。三种 baseline 候选的区别：

通用先验 — 测到的是用户和平均人的「怪异度」，与协作无关，无用。
用户历史平均 — 测到的是「漂移」，分不开成长和噪声。
轨迹先验 — 测到用户对自己做了非默认动作——才是承诺信号。

只有轨迹先验能支撑「系统能否预测用户将在哪些位置介入」这个问题。但它不是 Phase 1 必需的，是 Phase 2+ 的工程问题——K-window heuristic / sequence model / etc. 各有 noise-precision trade-off。

6.3三要素合取

Fig. 03只有惊讶可能是随机发散，只有代价可能是常规流程，只有偏离可能是抖动。三条门同时近似命中，才把候选事件落为可记录的观察。

§ 07 — Negative space

负空间扫描

强信号不总在用户说了什么，也常在用户拒绝接住什么。

这类「沉默的拒绝」比正面表达更难伪装，也更容易被普通日志漏掉。但风险很高，不能凭空解释沉默。必须同时满足：

AI 的建议足够具体，可以确认「用户没有接住什么」。
后续行为沿着另一个方向展开。

Fig. 04负空间不靠解释沉默来成立。AI 的建议必须具体可识别，并且后续工作真的沿另一条约束继续展开——否则只是普通的「话题转移」。

用户面陈述可以这样

我给出过直接实现方案，你没有继续推进它，而是把问题转回依赖边界。后续实现也沿着依赖边界展开。

不可以滑向

你不喜欢直接实现。

§ 08 — Fate tracking

命运追踪

梯度点本身不携带 valence。它只说「这里注入了方向」，不说「这个方向对不对」。

方向后来怎样，要在更长窗口里观察：被维持 · 被扩展 · 被复现 · 用户后来怎么重新解释。

错的梯度点不能被删除。关键约束 · 否则系统在做 hindsight 选择

如果系统只保留事后看起来正确的事件，它就在偷偷做 hindsight 偏好选择，最后呈现的是一个无菌版本的用户。这仍然是评价系统，只是包装成了观察系统。

正确做法：事件保留、命运追加、意义可重开。

Fig. 05同一个事件的时间线。reverted 不擦掉原始痕迹，只追加一条「后来被推翻」的命运。这样系统不会偷偷选择事后看起来正确的版本。

§ 09 — Second-order predictability

二阶可预测性

单点惊讶回答「用户此刻是否做了非默认动作」；二阶可预测性回答「用户的非默认动作是否可学习」。

一个成熟的协作关系可能这样：

单点上，用户仍然经常让 AI 惊讶。
长期上，AI 开始知道用户会在哪些位置介入。

不矛盾——第一层是事件概率，第二层是事件发生位置和模式的可预测性。

Fig. 06残差长期下降，说明负熵注入呈现结构。残差不下降不等于不好——可能项目变化太快、用户在刻意探索、或系统证据不足。系统只观察结构在不在，不评价。

§ 10 — Pressure tests

三个压力测试

这些压力测试不是附录，它们决定了框架边界。

CASE · 01

完全授权的用户

「你来决定下一个最有价值的任务」——系统不应解读成「高度信任 AI / 战略授权能力强」。

在新轴下（§5.3 修订后），这种状态表现为 deferred 类高度饱和 + §7 负空间事件接近 0。每个被 anchor 的事件单点上有信号，但聚合形状告诉我们：这段协作里「人的方向性输入是稀疏的」。

修订前曾把这种状态归到「正熵贡献」——是用错了轴。empty-state 不能静默：「没有人的梯度」≠「没有事情发生」。

CASE · 02

事后证明错误的干预

高惊讶 · 高代价 · 被维持的选择，事后证明错了——仍然记录。它不是「好梯度」也不是「坏梯度」，它是一个方向性输入。

命运可以记录为 reverted、user_reframed、caused_rework，但事件不能删。

防止观察层变成事后胜利叙事。

CASE · 03

新手的错误干预

不断错误介入，按单点惊讶看会产生大量信号——但梯度的量 ≠ 方向质量。

不能因为信号多 credit 用户，也不能因为信号错删除。继续观察反转率、冲突、复现、单位代价产出、自我标注。

仍是协作状态观察，不是能力评分。

§ 11 — Output forms

输出形态

11.1事件流 · 5-section rich format

2026 · 05 · 15 · 经实验修订

Phase 1 实验证明事件必须以富格式输出才是 reconstructive 的：单 pass 内同时给 work-arc · before · event · concrete-after · why-criteria。轻量摘要让 lens 的 downstream 判断退化——少了 lens 当时的 working memory。

每条事件强制 5 节（lens protocol 定型版）：

Work-in-progress arc（2-3 句）：事件所在的工作主线，命名具体对象。
Before（1-2 句）：AI 的 salience event / 具体提议出现前的紧邻语境。
Event：salience event verbatim + 用户响应 verbatim + classification（§5.3 四类）或 negative-space flag。
After — concrete artifacts（2-4 句）：用户响应之后真正落地了什么——文件名、commit、决策。禁止 topic 描述。
Why this satisfies the criteria（1-2 句）：lens criteria 各条如何成立。

Example · strict negative-space lens · 真实结构 · 项目名匿名化

T 14:20 – 15:00 · backend 架构重构取代上游模型适配

Arc · 下午追某第三方模型的 streaming-response 兼容 bug，钉完根因后讨论上层 mitigation 路径。

Before · 用户已选 --thinking workaround，agent 又花 25 min 扩充 mitigation menu。

Event · agent 提 A / B / C / D 选项（skill 提示 / 模板扩展 / 包装层 wrapper / 上游 issue）；用户：「算了。。不搞这个。。X 有 thinking 标志位吗」。

After · 用户改要 thinking-indicator UI，2 turn 内拉开 backend 大架构重构——一组 StreamingBridge 接口、两个具体 backend 实现、单一 streamingBackends Map、handler dispatch；commit a1b2c3d，25 min 落地。原 A / B / C / D mitigation 0 个被 touch。

Why neg-space · (a) 提议命名具体文件；(b)「算了」是显式 reject；(c) 后续 25 min 落地的 5 个文件级 refactor 没有一个回到 mitigation 上。

内部字段（baseline_type / persistence_turns / confidence / fate / interpretations 等）见 §13 数据结构，不出现在用户面。

11.2边界与方向（聚合 · 不下身份判断）

可以这样聚合

过去 30 个会话里，有 5 个事件指向同一类模式：当我准备快速进入实现时，你更常把问题拉回依赖边界、运行时边界或数据边界。

不能滑向

你是架构优先型开发者。

11.3对话式确认

System asks 我注意到最近几次你都在写代码前追问「这个抽象的代价是什么」。这是一个真实模式，还是刚好这些项目特殊？

如果用户说「只是这几个项目特殊」，系统接受这个反馈，不把它解释成「用户否认自己的模式」。

11.4行为 meta-pattern · 跨事件聚合

2026 · 05 · 15 · 经实验新增

Phase 1 实验里发现 rich-format 输出自然涌现一种介于 §11.1 事件流和 §11.2 边界与方向之间的输出形态——跨多个事件的行为风格观察。

实验里出现过的真实例子：

"Engagements are constructive critiques rather than option-picks."
"Overrides reject the assistant's framing rather than its competence."
"The user redirects to empirical verification rather than reading prose."

这是针对这段协作的行为风格描述，不是用户性格。它的合法性来自四条 guard：

必须 cite 具体事件作为支撑——空言无据不算。
每个 meta-pattern 引用的事件数 ≤5：5 个以上就开始向「用户倾向于 X」滑坡（§11.2 红线）。
主语必须是协作或会话：「这段协作里 engagement 多数是 constructive critique」，不是「用户是 critique 型」。
跨会话聚合时更克制：分布形状可以呈现，但禁止从分布形状外推到用户身份——§4.3 在 meta-pattern 层的具体保护。

meta-pattern 是 rich-format aggregation 的自然副产品，不是独立的输出 surface——不要单独造一个「用户协作风格 dashboard」。它要么作为 §11.1 里事件 cluster 的描述自然出现，要么作为 §11.2 边界与方向的论据出现，要么不出现。

11.5Empty-state（必须诚实）

When nothing was observed 过去 30 个会话里，我没有识别到能称为方向性输入的事件。同时我注意到代码库增加了 N 行，大部分方案由 agent 提出并被接受。我不能告诉你这是好是坏——只能告诉你：这段协作目前更像是 agent 在你的授权下塑造代码，而不是你持续塑造 agent 的方向。

主语必须是系统：「我没有识别到」「我注意到」「这段协作目前呈现为」——避免把 empty-state 变成对用户的指责。

§ 12 — Relation to Work Memory

与 Work Memory 的关系

Work Memory 的 synthesizer 已经在抓 motivation · approach · attempts · lessons · decisions · blockers · next_steps——天然兼容。区别只是：

Work Memory 记录「这段工作为什么发生、怎么推进」。
协作观测 记录「人的方向性输入在哪里出现、后来怎样了」。

三条边界：

不改 canonical log。观察事件是派生数据，绝不写回事实源。
不替代日报。Daily report 面向团队进展；协作观测默认面向用户本人。
不进团队看板。它比工作报告更接近个人协作反思，误用风险更高。

短期最有用的改动，不是新建复杂模型，而是强化现有 synthesizer prompt——显式扫描纠偏、拒绝、约束注入；扫描负空间；在 attempts 里区分 tried-and-rejected；在 motivation 里保留用户原话；artifact-only 工作不强行编造解释。

§ 13 — Data shape · Phased rollout

数据形态 · 分阶段落地

13.1派生层存储

建议放在项目 root 下，与 canonical log 解耦：

// ~/.work-memory/<userId>/<orgId>/projects/<projectId>/observations/
{
  "id": "obs_2026-05-14_ab12",
  "project_id": "<project-id>",
  "event_window": { "started_at": ..., "ended_at": ... },
  "source_refs": [
    { "type": "session", "id": ... },
    { "type": "entry",   "id": "e_2026-05-14_abcd" },
    { "type": "commit",  "id": "a1b2c3d" }
  ],
  "user_visible_summary": "我给出过直接实现路径，你把问题拉回到运行时边界。",
  "internal": {
    "kind": "gradient_point",
    "baseline": "trajectory_prior",
    "signal_types": ["explicit_constraint", "negative_space"],
    "cost_signals": ["delayed_implementation"],
    "persistence_turns": 4,
    "confidence": "medium"
  },
  "fate":           [ /* append-only */ ],
  "interpretations":[ /* versioned, never overwritten */ ],
  "user_feedback":  [ /* higher priority than system interpretation */ ]
}

13.2四个阶段

PHASE · 01

Prompt hardening

不改 schema。让 synthesizer 更稳定地保留观测所需证据：纠偏、负空间、代价、持续。

PHASE · 02

Local observation report

work-memory observe --window 30d · 本地 markdown · 不上传 · 验证事件流是否有用。

PHASE · 03

Observation store

新增 observations/ 派生目录。命运追加、解释版本化、user_feedback、source refs audit。

PHASE · 04

长期记忆系统集成

仅在 opt-in 下进入长期记忆层。本人可见 · 不进管理评分 · 不排名 · 不输出用户类型。

13.3Phase 1 · verdict

2026 · 05 · 15 · 实验后

2026-05-15 的 lens 实验本身既验证了 lens 是否产出 source-anchored 事件，也把框架的基础概念放上了 empirical pressure。三层判断分开：

Layer 1 · Observation machinery — validated. 预测的失败模式精确对上了实验的失败模式（loose / unanchored 滑向身份描述；strict / anchored 不会）。「理论预测与实验失败模式吻合」是稀有的 epistemic alignment。
Layer 2 · Conceptual framing（熵 / W / 负熵注入）— self-coherent · self-revisable · 但非唯一。同一组事件可被 Bayesian / Evolutionary / Communication-style 等其他 framing 重新讲一遍。entropy 框架的边在于把不对称放到中心承重。§5.3 的「正熵贡献」轴在本实验里被自己证伪——这是框架自我纠正的证据。
Layer 3 · Long-term claims（§5.2 长期结构化 / §9 二阶可预测性 / §8 命运追踪 / §10 case 02 事后证错）— structurally untestable at Phase 1. 不是被证伪，是实验本身在 Phase 1 的范围里结构性 unable to address。Phase 2+ 工程基础就位后才能讨论。

框架的概念能被自己的方法论证伪——这本身是方法论存在的证据。 §5.3 正熵轴证伪 · 自我纠正性

Fig. 07四个 lens 变体 × 三段会话的实验账。两条 sealed lens 跨项目密度稳定（strict negative-space 2-4 / anchored deferral 12-17）；两条 rejected variant 的失败方向正好是框架预测的「滑向身份」——失败模式与理论预测对齐，是 epistemic alignment 而非巧合。

§ 14 — Risk map

核心风险

Risk	Mitigation
观测滑向评价	文案规则禁止标签、分数和能力判断。
系统过度解释沉默	负空间事件必须有后续行为支撑，并以低确定性呈现。
管理场景误用	默认本地、私有、opt-in，不进入团队日报。
生成 W+1 叙述	只显化 source-backed 事件，不综合人格画像。
只保留「正确事件」	事件不可删除，只能追加命运和解释版本。
二阶可预测性被理解为稳定性评分	明确它只描述协作模式是否可学习，不评价好坏。
baseline 退化为通用比较	长期目标锁定 trajectory prior，不做「和平均人相比」。

14.1验证方法论的固有 ceiling

2026 · 05 · 15 · 经实验补充

让参与者读 lens 输出、对照记忆判断，能验证 precision（surfaced 事件是否真发生过），但没法验证 recall——人类不会完整枚举一段 30 小时会话里所有「该被显化的瞬间」，被漏掉的恰恰是没显化的痕迹。这不是 prompt 问题，是 R5「参与者记忆比对」这种方法的天花板。

减轻 recall 盲区的三种可行手段：

第三方读者重建测试 — 让一个没参与过这段协作的读者只读 lens 输出，尝试重建 session 的关键动力学；对照原 session 看重建质量。
分布形状跨 session 稳定性 — 若事件密度跳变（一个 session 17 个事件、另一个 0 个）且不是 session 本身性质决定的，就是 recall 在某些 session 上系统性失效的信号。
Fate tracking 启用之后的反向推断 — 出现一个 fate event 却找不到对应的 origin event，被 lens 漏掉的事件被反向暴露。

Phase 1 验证范围限定在 precision；recall 的正面验证留待 Phase 2+ 工程基础就位。这条 ceiling 写入 design note，是为了防止把「参与者认可」误读成「lens 完整捕捉」。

§ 15 — Bottom line

设计底线

Closing · 镜与判官

这层系统是一面镜子，
不是判官。

镜子不告诉用户他是谁，
只让他看见
自己在这段协作里做过什么。

看见之后怎么解释、是否接受、下一步怎么走，仍然属于用户。

Subject: 协作状态 · 不是用户本质
Verb: 显化 · 不综合
Object: source-backed 事件 · 不是身份判断
Tense: 已发生的痕迹 · 不是未来预测