un — シミュレーションの幾何 II：モデルの妥当性として幾何学的フィッティング

un

ゲスト

1 / ?

レッスン一覧に戻る

モデルを適合させるという本当の意味

シミュレーションモデルは数学的な主張を立てます：実際のシステムの出力は観測空間の特定の表面M上または近くに位置するものです。

実際のシステムがy₁, y₂, ..., yₙの観測値を生み出します。モデルはŷ₁, ŷ₂, ..., ŷₙの予測値を提供します。

残差を距離として：rᵢ = yᵢ - ŷᵢ。各残差は観測値とその対応する予測値との間の距離を測定します。n次元の観測空間で、残差はベクトルr = y - ŷを形成します。

最小二乗フィッティング：モデルパラメータを||r||² = Σrᵢ²を最小化するものに選びます。幾何学的に、観測ベクトルyから最も近い実際のデータマンホールドM上の点ŷをEuclidean距離で検索します。

残差が誤解を与える場合

小さな||r||²は、有効なモデルを保証しません。2つの体系的な失敗モードがあります：

1. 系統的なバイアス：残差rᵢはすべて正（またはすべて負）であるが、小さいです。モデルは一貫して過小評価または過大評価します。幾何学的には、ŷは実際のデータマンホールドの平行オフセット表面上に位置しています - 距離では近いが、構造では間違っています。

2. 正しいマンホールドではない：残差は小さいのは、モデルが訓練データを完全にフィッティングすることができるだけの自由度があり、過度にフィッティングしています。モデル表面はデータポイントを通過し、間にはうまく曲がっています。新しいデータへの予測は低いです。

Residuals, Bias, & Manifold Fitting

体系的なバイアスの検出

平均残差が0であるモデルでも、入力変数に関係する体系的なバイアスが存在することがあります。

例：気象シミュレーションが夏に2°Cを過小評価し、冬に2°Cを過大評価する場合、全年を通じて平均残差≈0であるにもかかわらず、季節的なバイアスが明らかです。

残差診断：入力変数ごとにrᵢをプロットします。平坦なパターン（傾向なし）は、その変数からの体系的なバイアスがないことを示します。傾向のあるパターンは、モデルに欠けている次元が示されます。

ハミングの検証問題「小さな重要な効果が欠けているかもしれない」というのは、幾何学的に次のようになります：残差ベクターがモデルパラメータ空間を支配しない方向に成分を持つか?

4つのデータポイント（1, 3）、（2, 5）、（3, 8）、（4, 9）に対して、回帰モデルy = ax + bを適合させます。適合した直線はa = 2、b = 1で、予測値ŷ = (3, 5, 7, 9)を提供します。残差を計算してください。それらは体系的であるか（パターンが見られますか）、またはランダムのように見えますか？モデル残差のパターンに基づいて、幾何学的なプロパティを修正する必要がありますか？

体系的なオフセット vs ランダムノイズ

ハーウォーン効果：研究対象が、実験的処置ではなく、観察されていることを知っているからであると、研究で行動を変えることがあります。

幾何学的解釈

真のデータマニホールド M は、変数 (x₁, x₂, ..., xₖ, 観察コンテキスト) によって支配されます。

モデルは観察コンテキストを無視します。観察コンテキストを除く (x₁, ..., xₖ) のみで観測値にsurface を適合します。

観察コンテキストが '研究されている' の場合、実際のデータポイントは観察コンテキスト軸沿って移動します。モデルが研究コンテキストで適合するsurface は (x₁, ..., xₖ) 空間で固定されていますが、観察コンテキストが観察されていない場合の予測は体系的に誤っています。

幾何学：モデルsurface は研究コンテキストのデータマニホールドに近いですが、現実のマニホールドとは遠いです。彼らとの間の距離：ハーウォーンのオフセットである観察コンテキスト軸の方向に沿って。

ハミングのダブルブラインド要件：観察コンテキストが治療と関連することがないようにすることです。これにより、現実のマニホールドと研究コンテキストのマニホールドが一致することになり、幾何学的なオフセットが除去されます。

その他の隠れた次元効果

どの変数もがシステムに影響を与えるがモデルから除外される場合、同じ幾何構造が作成される:

- 経済モデルから省略された季節効果

- 製造シミュレーションからオペレーター行動が除外される

- パフォーマンスモデルからソフトウェアバージョン状態が欠落する

モデルは、データがより高次元のマンホールドに存在するが、より低次元の表面に適合する。残差は、モデルが測定する方向では小さいが、測定されない方向では大きい。

検証としての幾何学的整合性

ハミングの検証チェックリスト、幾何学的に再構成されたもの:

背景理論が推奨される法則をサポートしているか：モデルパラメータ空間の次元が、実データマンホールドを正確に支配しているか？重要な変数が欠落している場合（除外された次元）、モデル表面は現実と整合性を保てない。

内部チェックが利用可能か：保存法則は幾何学的制約である：データは質量保存、エネルギー保存などの特定のサブマンホールドに存在しなければならない。シミュレーションがこれらの制約を違反すると、その軌道は有効なサブマンホールドを離れてしまう。

過去の経験とのクロスチェック：モデル表面は歴史的な検証ポイントを通過しなければならない - トレーニングデータに適合するだけでなく、検証データに適応することが求められる。

シミュレーションが安定しているか：安定したシミュレーションは、微小な乱れにもかかわらず、正確な解マンホールドの近くに位置する。安定しないシミュレーションは、マンホールドの近傍を離れて有効なモデルと呼ばれなくなる。

ハミングは、ビジネスシミュレーションや戦略ゲームでは、参加者がシミュレーションであることを知っていると、行動が変わることを指摘した。参加者がシミュレーションであることを知っていると、シミュレーションが実際の行動を正確に表していないことを示す。この場合、シミュレーションが失敗する幾何学的特性を特定し（『ハーウェル効果』だけでは説明できない）、ダブルブラインド条件を必要としないシミュレーション現実のギャップを検出する検証テストを提案してください。

予測がプロジェクションになる時

Hammingは、予測が不可能なドメインではシナリオ法を推奨した：システムがXを行うと主張するのではなく、異なる仮定セットの下での可能なトラジェクトリを提示する。

ジオメトリックな解釈

モデル表面M(θ)は、システムの法則、定数、境界条件に関する仮定のパラメータθに依存する。異なる仮定セットθ₁, θ₂, ..., θₖは異なる表面M(θ₁), ..., M(θₖ)を定義する。

シナリオエンvelopeは、これらの表面の合計である：どのシナリオモデルも生み出すことができる出力空間の領域。

単一の予測は、真の結果が最良の推定θに対応するM(θ)の近くに位置することを主張する。シナリオ法は、真の結果がエンvelope内部に位置することを主張する。

エンvelopeが有用な場合

エンvelopeが狭い場合：異なる仮定セットにもかかわらず、出力についてシナリオモデルは一致する信頼感が高い。エンvelopeが広い場合：異なる仮定で非常に異なる出力を生み出す場合：モデルは非常に仮定に敏感である。その敏感性は、出力ではなく、失敗モードではない。

Hammingの自分の予測に関する主張：彼はシナリオを提供していたではなく、ポイント予測を提供していた。彼が描いた未来は「私の意見で予想されるものであり、確実な予測ではない。

現実との重なり

シナリオモデルは、現実がエンvelope内に位置する場合に検証される。このポイント予測よりも弱いテストであるが、モデルが主張できるものについて誠実である。

整理：有効なモデルとそのジオメトリ

有効なシミュレーションの幾何学は、3つの対称性に帰着します：

1. パラメータースペースが真の多様体をカバーする: モデルの次元がシステムをドライブするすべての変数を含む。隠れた次元のギャップは、システム的オフセットを生じます。

2. 安定性が真の多様体の軌道を近くに保つ:収束方向場が存在する場合、誤差は縮みます。散逸場の場合、シミュレーションは有効な領域を離れます。

3. 残差が小さくて無構造的である:ランダムで相関のない残差は、モデルが真の多様体を正確に捉えていることを示します。構造化された残差（傾向、パターン）は、次元が不足していることを示します。

ハミングの '誰もがシミュレーションを信じるべき理由?' は幾何学的に次のようになります：モデル表面と現実の多様体の距離はどれくらいですか？次元はどれくらいですか？安定性はどれくらいですか？バリデーションデータポイントは何個ですか？

橋建設プロジェクトのスケジュール予測モデルを構築しています。モデルは次の要素を使用しています：計画期間（週）、チーム規模（人）、予算比率（実際/計画）。同僚は、重要な変数が欠けていると主張しています。このレッスンの幾何学的枠組みを使用して、予測にシステム的バイアスを作成するmissing変数のタイプと、バイアスなしで予測の分散を増加させるmissing変数のタイプをそれぞれ1つずつ説明してください。説明に際して、これらの効果の幾何学的な違いを説明してください。