English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

guest
1 / ?
back to lessons

什麼是真正的模型適應

一個模擬模型提出一個數學主張:實際系統的輸出位於(或接近)特定表面 M 在觀察空間中的位置。

讓實際系統產生觀察值 y₁,y₂,...,yₙ。模型預測值 ŷ₁,ŷ₂,...,ŷₙ。

殘差作為距離:rᵢ = yᵢ - ŷᵢ。每個殘差測量觀察值與其對應模型預測值之間的距離。在 n維觀察空間中,殘差形成一個向量 r = y - ŷ。

最小二乘適應:選擇模型參數以最小化 ||r||² = Σrᵢ²。幾何上,找到模型表面 M 上的點 ŷ,最近於觀察向量 y 在歐幾里得距離。

當殘差誤導

小的 ||r||² 不保證有效模型。兩種系統失敗模式:

1. 系統偏差:殘差 rᵢ 都是正的(或都是負的)。模型一致低估或高估。幾何上:ŷ 位於真實數據流形的平行偏移表面之上——在結構上錯誤,雖然在距離上接近。

2. 錯誤流形:殘差小,因為模型有足夠的自由參數可以精確地適應訓練數據(過擬合)。模型表面穿過數據點,但在點之間曲折。對新數據的預測效果差。

Residuals, Bias, & Manifold Fitting

檢測系統偏差

具有零均值殘差的模型可能仍然存在與輸入變量相關的系統偏差。

例子:一個氣象模擬,夏天低估溫度2°C,冬天高估2°C,雖然在全年內殘差的平均值約為0,但具有明顯的季節性偏差。

殘差診斷:將 rᵢ 對每個輸入變量進行繪圖。如果沒有趨勢模式,則表明該變量沒有系統偏差。如果存在趨勢模式,則表明模型中缺少維度。

Hamming的驗證問題——'一個小但關鍵的效果是否遺失了?'——在幾何學上翻譯為:剩餘向量是否具有在模型參數空間中未被展開的方向分量?

一個回歸模型 y = ax + b 對 4 個數據點進行適應:(1,3),(2,5),(3,8),(4,9)。適應線的 a = 2,b = 1,給出預測值 ŷ = (3,5,7,9)。計算殘差。然後:殘差是否系統性(是否顯示模式),或者看起來是隨機的?基於殘差模式,您將根據哪些幾何性質進行修正?

系統偏差與隨機雜訊

哈沃斯效應:在研究中,受試者因為知道自己被觀察而改變行為,而不是因為實驗處理。

几何解釋

讓真實數據流形 M 在由變量 (x₁, x₂, ..., xₖ, 觀察上下文) 組成的空間中生存。

模型忽略觀察上下文。它將觀察值在 (x₁, ..., xₖ) 中的數據繪製成一個表面。

當觀察上下文為 '正在研究',實際數據點沿著觀察上下文軸進行移動。模型的表面——在 (x₁, ..., xₖ) 空間中固定——現在適合遷移數據。剩餘值看起來很小(表面在研究上下文內仍然適合),但在未觀察到的上下文中,預測是系統性錯誤的。

幾何:模型表面接近研究上下文數據流形,但遠離真實流形。距離之間:哈沃斯偏移沿著觀察上下文軸。

Hamming的雙盲要求:防止觀察上下文與處理相關。這將使真實流形和研究上下文流形重合——消除幾何偏移。

其他隱藏維度效應

任何影响系统但被排除在模型之外的变量会创建相同的几何结构:

- 从经济模型中省略的季节效应

- 从制造模拟中排除的操作员行为

- 在性能模型中缺少的软件版本状态

模型将生活在更高维子空间中的数据拟合到一个低维表面上。残差在模型测量的方向上会很小,在未测量的方向上会很大。

验证作为几何对齐

Hamming的验证清单,用几何来重新表述:

背景理论是否支持假设的法则? 模型参数空间的维度是否覆盖了真实数据的子空间?如果关键变量被排除(被排除的维度),模型表面就无法与现实保持对齐。

内部检查是否可用? 保存律是几何约束:数据必须位于由质量守恒、能量守恒等定义的特定子空间。如果模拟违反这些约束,它的轨迹已经离开了有效的子空间。

与已知过去经历进行交叉检查: 模型表面必须通过历史验证点——不仅仅是适应训练数据,还要将模型推广到未见样本观察中。

模拟是否稳定? 稳定的模拟在小扰动下仍然接近真实解的子空间。不可靠的模拟离开子空间,无法称为有效模型。

Hamming指出,在商业模拟和战争游戏中,知道自己在模拟中参与的人会改变他们的行为——这使得模拟成为一个不太可靠的真实行为模型。请在这个情况下,描述模拟失败的几何特性(不仅是‘哈韦尔效应’),然后提出一个检测模拟与现实之间差距的验证测试,不需要双盲条件。

預測變成投影時

Hamming 支持在預測不可能的領域中使用場景方法:而不是宣稱「系統將做 X」,提供在不同假設集下的可能路徑集。

几何解釋

模型表面 M(θ) 依賴於參數 θ(對法律、常數和邊界條件的假設)。不同假設集 θ₁,θ₂,...,θₖ 定義不同的表面 M(θ₁),...,M(θₖ)。

場景包圍物是這些表面之間的聯集:模型可能產生的輸出空間區域。

單個預測聲稱:真實結果位於最佳估計 θ 的 M(θ) 附近。場景方法聲稱:真實結果位於包圍物內。

當包圍物有用時

如果包圍物狹窄——不同假設下的輸出一致——對預測的信心高。如果包圍物寬——不同假設產生非常不同的輸出——模型對假設非常敏感。這種敏感性是輸出,而不是失敗模式。

Hamming 對他自己的預測的聲明:他在給場景,而不是單點預測。他描述的未來是「在我看來,很可能發生的事情」,而不是精確的預測。

與現實的重疊

場景模型在現實落在包圍物內時得到驗證。這是一個比單點預測更弱的測試,但對模型可以聲稱的更真實。

把它們放在一起:有效模型及其幾何

有效模擬的幾何歸結為三個對齊:

1. 參數空間覆蓋真實多維度: 模型的維度包括驅動系統的所有變數。隱藏維度的差距會產生系統偏差。

2. 穩定性使軌跡接近真實多維度: 收敛方向場意味著錯誤會縮小。分裂場意味著模擬會離有效區域。

3. 殘差小且無結構: 隨機、無相關的殘差表明模型捕捉了真實多維度。結構化殘差(趨勢、模式)意味著缺少維度。

Hamming 的『任何人為什麼相信模擬?』在幾何上翻譯為:模型表面與現實多維度之間的距離是多少,具有多少維度的穩定性,經過了多少個外樣點的驗證?

您正在建立一個預測橋樑建設項目是否按時完成的模型。您的模型使用:計劃時程(週)、團隊規模(人)和預算比(實際/計劃)。一個同事主張您遺漏了關鍵變數。根據這堂課的幾何框架,描述兩種遺漏變數:一種會在預測中產生系統偏見,一種會增加預測變異度但不產生偏見。解釋這兩種效果在幾何上之間的區別。