un — 測定する者が得るもの：幾何学

un

ゲスト

1 / ?

レッスン一覧に戻る

価値空間対測定空間

世界を2つの空間としてモデル化してください：

価値空間 V：あなたが実際に気にかけることに関して、世界の状態の集合。V の点は、真の基礎的な量（学生の学習、軍事的進歩、経済的幸福）の異なるレベルを表します。

測定空間 M：メトリックが取ることのできる値の集合。メトリックは関数 f: V → M です。価値空間から測定空間への写像です。

有効なメトリックは、f が関連する領域で等距変換に近い場合です。M での等しい変化は V での等しい変化に対応します。M での近い点は V での近い点に対応します。

歪んだメトリックは、f が非等距変換である場合です。メトリックは V のいくつかの領域を圧縮し（大きな変化を見えなくする）、他を拡大します（小さな変化を大きく見せる）。IQ キャリブレーションは意図された歪みです。V での真の知能分布に関係なく、生のスコア分布を M のガウス分布にマップします。

マッピング用語でのグッドハートの法則：M が目標になると、エージェントは M で勾配上昇を適用します。f は歪みであるため、M での勾配上昇は V での勾配上昇に対応しません。エージェントは M で移動しますが、V では移動しません（または後方に移動します）。

メトリック歪み：価値空間対測定空間

メトリック妥当性のテスト

ある企業は従業員のパフォーマンスを1～5つ星スケールで評価しています。スケールは、従業員の80％が3以上を受け取るように調整されています。パフォーマンスレビューシステムは、報酬決定（ランク順序が重要）と改善計画（絶対レベルが重要）の両方に使用されます。

このメトリックは、真のパフォーマンスの等距写像に近いですか、それとも歪んだ写像に近いですか？圧縮と拡大の概念を使って説明してください。その後：どのユースケース（報酬または改善計画）で歪みがより重要であり、なぜですか？

誤った空間での勾配上昇

最適化問題を幾何学的にモデル化してください。V = 価値空間（真の学生の学習、軍事的進歩など）とし、M = メトリック空間（テストスコア、死傷者数など）とします。

真の価値の勾配：∇_V(value) は、あなたが気にかけている基礎的な量を増やす V の方向を指します。

メトリックの勾配：∇_M(metric) は、メトリックを増やす M の方向を指します。

f: V → M は等距変換ではないため、価値空間のメトリック勾配（f(∇_M)）は ∇_V と整列していません。それらの間の角度θ = arccos(∇_V · f(∇_M) / (|∇_V| |f*(∇_M)|)) は、グッドハート障害の重大度を測定します。

θ = 0 の場合：メトリック勾配と価値勾配は同じ方向を指します。メトリックを最適化すると、価値が最適化されます。グッドハート腐敗はありません。

θ = 90° の場合：メトリック勾配は価値に直交しています。メトリックを最適化すると、V で移動することなく M で移動します。

θ = 180° の場合：メトリック勾配は価値の反対を指します。メトリックを最適化すると、値を積極的に低下させます。

メトリックがターゲットになり、エージェントがメトリックに対して勾配上昇を適用すると、∇_V ではなく f*(∇_M) に従います。勾配上昇の乖離角 θ は、メトリックが操作されるにつれて時間とともに増加します。∇_M と ∇_V が最も分岐する領域がゲーム化の最も効率的なパスであるため、エージェントがそれらを見つけるにつれて、写像 f はより等距ではなくなります。

乖離を測定する

スキル = 学生の実際の理解、コンプライアンス = テスト受験手順に従う学生の能力の簡単な2次元価値空間 V = (スキル、コンプライアンス) を考えてください。

テストメトリック M = 0.3 × スキル + 0.7 × コンプライアンス（特定の線形結合。コンプライアンスの重みは70％）。

このモデルでは、メトリックの勾配は（スキル、コンプライアンス）空間のベクトル（0.3、0.7）です。学生はコンプライアンスのみを改善することでメトリックを最適化しています（価値空間の（0、1）方向で移動しています）。メトリック勾配と純粋なスキル方向（1、0）の間の角度の余弦を計算してください。説明してください：メトリック勾配は「スキルの増加」に良く整列していますか（θ が小さい）、それとも悪く整列していますか（θ が大きい）？このメトリックを最適化するときに学生に何が起こるかを予測します。

グッドハートに対する防御としてのマルチ目的最適化

ハミングの防御：複数のメトリックを同時に使用します。幾何学的解釈：単一の目的関数 f(x) を最大化する代わりに、目的のベクトル F(x) = (f₁(x), f₂(x), ..., fₖ(x)) を最適化します。

ベクトル目的の場合、解の概念はパレート境界です。目的を改善することが別の目的を悪化させることなくできない解のセット。パレート境界は単一の最適値を置き換えます。

これがグッドハートに対する防御である理由：メトリックを操作するために、合理的なエージェントは、すべての fᵢ を同時に増やす（または、少なくとも判断されているメトリックを増やす）価値空間の方向を見つける必要があります。メトリックが十分に独立している場合、つまり勾配方向が十分に非平行である場合、そのような方向はありません。1つのメトリックを操作すると、別のメトリックが低下します。

防御の程度：k メトリック勾配が k 次元空間をまたがる場合（線形独立）、メトリックの適切な部分集合を最適化すると、少なくとも1つの除外されたメトリックが低下します。完全なパレート防御には、すべてのメトリックを改善するゲーム化方向が存在しないことが必要です。

測定不変性：メトリック M がメトリックが無関係な属性 α に関して不変である場合、M(x + δα) = M(x)。IQ メトリックは、テスト受験練習に関して不変ではありません。学生が主要な構成要素での真正な利益なしにテストを練習すると、IQ が変わります。

パレート防御されたメトリックシステムを設計する

研究科学者を2メトリックシステムで評価することを考えてください。M₁ = 1年あたりの出版物数、M₂ = 論文当たりの被引用率（論文あたりの引用）。

これら2つのメトリックが、単一のメトリックのみより一緒に操作するのが難しい理由を幾何学的に説明してください。具体的には、M₁ のみを最大化するための戦略、M₂ のみを最大化するための戦略を説明し、その後、これらの戦略のそれぞれが他のメトリックを低下させることを示してください。その後、真の研究価値を生成することなく両方を同時に増やす残りのゲーム化戦略がありますか。もしあれば、それは何ですか？