un — 你测量的就是你得到的—

un

访客

1 / ?

返回课程列表

价值空间与测量空间

将世界建模为两个空间：

价值空间 V：相对于你真正关心的事物的世界状态集合。V 中的点表示真实基础量的不同水平（学生学习、军事进展、经济福祉）。

测量空间 M：度量能取的值的集合。度量是函数 f: V → M——从价值空间到测量空间的映射。

有效的度量是 f 在相关区域接近等距映射的度量：M 中的相等变化对应 V 中的相等变化。M 中的邻近点对应 V 中的邻近点。

失真的度量是 f 非等距的度量：度量压缩了 V 的某些区域（使大的变化不可见）并扩展了其他区域（使小的变化看起来很大）。智商校准是一个设计的失真：它将原始分数分布映射到 M 中的高斯分布，不管 V 中智力的真实分布如何。

用映射术语说古德哈特定律：当 M 成为目标时，代理在 M 上应用梯度上升。因为 f 是失真，M 中的梯度上升不对应 V 中的梯度上升。代理在 M 中移动而在 V 中不移动（或向后移动）。

度量失真：价值空间与测量空间

测试度量有效性

一家公司在 1-5 星级量表上评估员工绩效。该量表经过校准，使得 80% 的员工获得 3 分或更高。绩效评审系统用于补偿决策（其中排名顺序很重要）和改进计划（其中绝对水平很重要）两个方面。

这个度量更接近真实绩效的等距映射还是失真映射？用压缩和扩张的概念解释。然后：对于哪个用例（补偿或改进计划），失真的影响更大，为什么？

在错误空间中的梯度上升

以几何方式对优化问题建模。设 V = 价值空间（真实学生学习、军事进展等）和 M = 度量空间（测试分数、身体计数等）。

真实价值的梯度：∇_V(value) 指向 V 中的方向，增加你关心的基础量。

度量的梯度：∇_M(metric) 指向 M 中的方向，增加度量。

因为 f: V → M 不是等距映射，度量梯度在价值空间中的方向（f(∇_M)）与 ∇_V 不对齐。它们之间的角度 θ = arccos(∇_V · f(∇_M) / (|∇_V| |f*(∇_M)|)) 测量古德哈特失败的严重程度。

如果 θ = 0°：度量梯度和价值梯度指向相同方向。优化度量优化价值。没有古德哈特腐败。

如果 θ = 90°：度量梯度与价值正交。优化度量在 M 中移动而不在 V 中移动。

如果 θ = 180°：度量梯度指向价值相反的方向。优化度量积极降低价值。

当度量成为目标并且代理在度量上应用梯度上升时，他们跟随 f*(∇_M)，而不是 ∇_V。随着时间推移，随着度量被操纵，发散角 θ 增长——度量变得不等距，因为代理找到了 ∇_M 和 ∇_V 发散最多的区域，因为这些是操纵最有效的路径。

测量发散

考虑一个简单的二维价值空间 V = (skill, compliance)，其中 skill = 学生的实际理解，compliance = 学生遵循考试程序的能力。

一个测试度量 M = 0.3 × skill + 0.7 × compliance（一个特定的线性组合，其中合规性的权重为 70%）。

在这个二维模型中，度量的梯度是向量（0.3, 0.7）在（skill, compliance）空间中。一个学生通过仅改进合规性来优化度量（在价值空间中的（0, 1）方向移动）。计算度量梯度和纯技能方向（1, 0）之间角度的余弦。解释：度量梯度与"增加技能"很好地对齐（θ 小）还是对齐不良（θ 大）？这对当学生为这个度量优化时会发生什么进行了什么预测？

多目标优化作为防御古德哈特

汉明的防御：同时使用多个度量。几何解释：与其最大化单个目标函数 f(x)，而是优化目标的向量 F(x) = (f₁(x), f₂(x), ..., fₖ(x))。

对于向量目标，解决方案概念是帕累托前沿：一组解，其中没有目标可以改进而不降低另一个目标。帕累托前沿取代了单一最优值。

为什么这防御古德哈特：为了操纵度量，理性代理必须在价值空间中找到一个方向，同时增加所有 fᵢ（或至少他们被评判的度量）。如果度量足够独立——他们的梯度方向足够非平行——就没有这样的方向。操纵一个度量会降低另一个度量。

防御程度：如果 k 个度量梯度跨越 k 维空间（线性独立），那么优化任何度量的合适子集会降低至少一个排除的度量。完全帕累托防御要求不存在改进所有度量的游戏方向。

测量不变性：度量 M 相对于无关属性 α 是不变的，如果 M(x + δα) = M(x) 对 α 中的变化。智商度量相对于考试准备不是不变的：当学生练习考试时 IQ 会改变，而没有基础构念的真正收益。

设计帕累托防御的度量系统

考虑在两度量系统上评估研究科学家：M₁ = 每年发表的论文数，M₂ = 每篇论文的引用率（每篇论文的引用数）。

从几何角度解释为什么这两个度量一起比单独任何一个度量更难被操纵。具体来说：描述单独最大化 M₁ 的策略、单独最大化 M₂ 的策略，然后展示这两个策略中的每一个是如何降低另一个度量的。然后：是否存在任何剩余的游戏策略可以同时增加两者而不产生真正的研究价值，如果存在，那是什么？