un — 模擬 II：為什麼應該相信它？

un

guest

1 / ?

back to lessons

核心問題

漢明在第19章開篇引用了1975年夏季計算機模擬會議的直接引文：

> 由於重要的決定必須依靠模擬，因此必須測試其有效性，模擬的倡導者必須能夠描述他們達到的真實表現水準。

他對同一問題的表述更為尖銳：

> 為什麼任何人都應該相信模擬是相關的？

在認真思考這個問題之前，不要開始模擬。通常有實際的壓力要立即開始計算——時間、金錢、組織動力。這些壓力不會改變問題。

漢明的經驗：當他對模擬的有效性提出質疑時，答案總是列舉：

- 投入多少人力

- 計算機有多大有多快

- 問題有多重要

這些答案都沒有涉及有效性。它們是社會論證，不是技術論證。

太空飛行故事：一位模擬主任聲稱發射的可靠性達到99.44%。漢明追問：什麼的可靠性？在被逼到牆角後，主任承認他的數字是模擬的可靠性，而不是實際飛行的可靠性。他進一步承認了批准發射的NASA主任不理解這種區別——而他沒有糾正這種誤解。

將模擬可靠性與系統可靠性混淆是工程實踐中最危險的錯誤之一。

驗證實際需要什麼

漢明彙編了一份清單，用於評估模擬可靠性。在模擬輸出值得決策權重之前，每個問題都必須得到回答：

1. 背景理論是否支持假設的定律？ 物理模擬建立在已驗證的方程上；經濟模擬通常沒有。

2. 可能缺少一個小但至關重要的效應嗎？ 飛行模擬器示例：對已知物理非常有用；如果新飛機有尚未納入的相互作用，則危險。

3. 輸入資料可靠嗎？ 輸入的不確定性會通過計算傳播。了解資料來源。

4. 模擬是穩定還是不穩定？ 不穩定的方向場會放大輸入誤差；穩定的會衰減它們。

5. 有哪些與已知過去經驗的交叉檢查？

6. 能產生內部檢查嗎？ 質量守恆、能量守恆、角動量守恆或其他不變量。沒有冗餘，就沒有可能進行錯誤檢測。

7. 紙上的標記是否準確地進入機器？ 編程錯誤在生產程式碼中持續多年。自動讀卡機將反應描述轉譯成微分方程——漢明對大氣化學模擬的解決方案——減少了轉錄錯誤，無需依賴人工警惕。

你被要求在模擬被用來做出重要的工程或政策決定之前檢查它。使用漢明的清單，確定你會優先考慮的兩個驗證問題，並解釋為什麼這兩個問題對於發現最危險的錯誤類別最為關鍵。

漢明的經濟學定律

物理模擬建立在已驗證的、數學表達的定律上。化學模擬需要已驗證的速率常數。生物模擬需要已知的種群動力學。

經濟學在漢明看來有一個可靠的定律：你不能消費沒有生產的東西。其他所有聲稱的經濟定律要麼是數學重言式，要麼有時是假的。

對模擬的含義：當背景定律不能可靠地成立時，模擬的整個基礎都值得懷疑。計算中的高精度無法彌補模型中不可靠的定律。

漢明被要求運行生態模擬時的回應：他要求對每個相互作用提供數學表達的規則、數值常數，以及真實資料來與測試運行進行比較。提出者很快找到了更願意運行『非常有問題的模擬的人，這些模擬會給出他們想要的結果』。

漢明的規則： 保持你的誠信。不要讓自己被用於他人的宣傳。拒絕在結構上設計為確認結論的模擬。

模擬資料中的辛普森悖論

漢明的伯克利故事：接受研究生的男性多於女性，暗示歧視。沒有單一系的系出現歧視。解釋：女性不成比例地申請低接受率的系；男性不成比例地申請高接受率的系。彙總統計是真實的，且具有誤導性。

這是辛普森悖論：組合資料可以創建任何子群中不存在的明顯效應。匯總組、地區或時間段的模擬輸出可能表現出相同的病理。

改變其模型對象的模擬

一種特殊的模擬失敗類別：主體改變行為以應對模型。

股票市場示例：如果廣為人知的交易策略能可靠地產生高於市場的回報，參與者將採用它，競爭將消除超額回報。該模型的成功摧毀了該模型的有效性。

醫學示例：雙盲實驗存在是因為知道哪些患者接受治療以及哪些患者接受安慰劑的醫生會在他們預期的地方發現改善。醫生的知識污染了觀察。

用於高風險決策的模擬——經濟政策、軍事規劃、公共衛生——在模擬的輸出被公開或指導行為時面臨這個問題。

漢明寫道：『認真地說，許多模擬不過是羅夏測驗而已。』他引用了傑伊·福雷斯特的承認，他在假設和系統行為之間反復循環，直到模型產生他想要的結果。什麼具體的科學實踐保障措施旨在防止這類自我確認的模擬，為什麼這項保障措施難以應用於模擬工作？

採樣與精度

奈奎斯特定理對連續系統的數位模擬設置了基本限制：信號中最高頻率的每個週期需要至少兩個樣本。

實際上，漢明指出，單邊採樣和混疊將要求推至最高感興趣頻率的每個週期七至十個樣本。

精度權衡： 類比計算機（在漢明的時代）每個元件最多達到十萬分之一的精度。數位計算機可以承載任意精度。但數位精度需要充分採樣——對於具有尖銳高頻內容的信號，該採樣率會驅動計算成本。

類比優勢： 速度和物理集成。你可以直接將物理元件接入類比電路並測量其行為，而無需找到其的數學描述。對於早期的導彈設計，這允許在完整數學模型存在之前快速了解系統。

用於早期飛彈工作的類比機器源自M9砲火指揮機的零件。漢明從這樣的設備構建了微分分析器。解決時間：每個軌跡約30分鐘。這種速度強制在運行之間進行深思——一個漢明開始視為結構優勢的限制。

感覺對精度：火星著陸器問題

漢明提出了一個尖銳的設計問題：對於火星著陸器飛行模擬器，應該優化位置精度還是車輛的感覺？

古典數值分析使用局部多項式逼近優化位置軌跡。路徑是準確的，但加速度在每個多項式區間處不連續變化——一種不自然的『感覺』。

頻域方法優化模擬器的頻率響應。位置可能不那麼準確，但飛行員正確地感知車輛的動態響應。飛行員的肌肉記憶在正確的傳遞函數上形成。

漢明的判斷： 飛行模擬器應優化感覺。在實際飛行中，飛行員可以通過反饋控制補償位置誤差。如果感覺是錯的，飛行員已經為不存在的車輛訓練過了。

更深層的原則：數值方法的選擇編碼了關於模擬是什麼的聲明。該聲明是一個領域判斷，而不是數學判斷。

古典數值分析與火星著陸器模擬器的頻域方法之間的辯論說明了漢明更廣泛的主張：模擬方法的選擇編碼了關於模擬目的是什麼的隱含聲明。從你的領域中選擇一個模擬。標準數值方法隱含地聲稱什麼最重要？對於模擬將支持的決策，該聲明是否正確？