un — 漢明第 27 章：不可靠的數據

un

guest

1 / ?

back to lessons

統計學家的公文包

漢明以一個故事開始第 27 章。貝爾實驗室的一位統計學家朋友懷疑研究中的測量不準確。他與部門主管爭論，後者拒絕重新測量——'儀器上面有黃銅標籤，標明它們準確到那個程度，而且我的人員很可靠。'

週一，統計學家來了，說他把公文包遺留在火車上，失去了所有數據。別無選擇，只能重新測量。當新的測量數據到達時，統計學家拿出原始記錄——顯示它們的偏差有多大。他因此舉動不太受歡迎，但不準確性現在是不可否認的。

漢明從另一個案例中得出更難的教訓：一項關於通話模式的研究，由放置通話的同一交換機設備記錄。一天，統計學家注意到一個通話被計費到一個不存在的交換機。進一步查看後，他發現大部分通話連接——持續幾分鐘——到不存在的辦公室。機器正在生成關於自身運作的錯誤數據。你無法信任機器來正確收集關於自己的數據。

他的第三個例子：他在洛杉磯空氣污染部門的哥哥，發現有必要對他們收到的每台新儀器進行拆卸、重新組裝和重新校準，無論製造商的聲稱如何。

漢明的規則：始終在處理數據之前仔細檢查數據。繪製它。尋找不應該存在的模式。檢查不一致之處。無論答案有多迫切，都要先預測數據。

隨機誤差、系統誤差與校準鏈

數據前測

漢明的庫存研究：他收到了大約 100 項商品 18 個月的庫存記錄，天真地相信供應商關於已移除不一致之處的保證。在項目後期，他發現了遺留的不一致——可能不會在沒有誤差的情況下發生的條目（例如，從空庫存中提取）。

他得出結論：'我首先必須找到它們，然後消除它們，然後再次運行數據。從這次經歷中，我學會了在仔細檢查數據中的誤差之前，永遠不要處理任何數據。'

描述三項具體的一致性檢查，你在信任新數據集進行分析之前會應用。對於每項檢查，解釋它會捕捉什麼類型的誤差——以及儘管供應商的保證，為什麼該類型的誤差可能存在於數據中。

兩種誤差

每項物理測量都包含兩種誤差：

隨機誤差：圍繞真實值的不可預測變化。它遵循以真實值為中心的分佈（通常近似為高斯分佈）。隨機誤差通過平均相互抵消：進行足夠的測量，均值就會接近真實值。

系統誤差（偏差）：一個方向上的持續偏移。你的所有測量都向同一方向偏移相同的量。沒有任何平均值可以消除它，因為許多有偏差的測量值的均值仍然有偏差。

漢明的物理學例子：編譯了 10 個基本常數表（光速、阿伏加德羅數、電子電荷等），然後 24 年後用改進的儀器重新編譯。平均而言，新值有 5.267 倍的情況落在舊的誤差棒之外。僅從隨機誤差來看這是不可信的——這麼大的隨機誤差是可以檢測到的。解釋：舊儀器有系統誤差，這些誤差沒有被包含在說明的不確定性中，技術本身有一個在整個社區傳播的共同缺陷。

香農的評論：'校準是測量中最重要的事情。'校準處理系統誤差。如果你的儀器始終讀數過高 3%，再多的重複測量也無法修復——你必須校準。

識別系統誤差

哈勃常數：宇宙膨脹的速率，通過星系的紅移-距離關係測量。在過去 50 年中，多個獨立小組對其進行了測量。從歷史上看，許多已發表的值都落在其他已發表值的誤差棒之外——意味著分歧比說明的不確定性預測的要大。

解釋為什麼哈勃常數的獨立測量可能各自有很小的說明隨機誤差，但仍然相差比這些誤差更大的量。什麼類型的誤差導致這種模式，你將如何通過實驗將其與隨機誤差區分開？

你如何測試無法測試的東西？

漢明提出了一個沒有清晰解決方案但每個從事工程的人最終都會面臨的問題：當測試本身花費的時間比你有的時間更長，而且你的測試設備不如你正在測試的設備可靠時，你如何測試設備的可靠性？

情景：設備必須在現場使用 20 年（175,000 小時）。你的壽命測試實驗室的額定值為 10,000 小時運行。你的測試期預算是 3 個月（大約 2,000 小時）。該設備預期在現場面臨高達 85°C 的工作溫度。

加速測試：在 105°C 下運行設備，並假設故障的發生速度比 85°C 快 10 倍（常見的工程經驗法則）。那麼 2,000 小時在 105°C 處'代表'20,000 小時在 85°C 處。但真的嗎？

問題：105°C 下的故障模式可能與 85°C 下的故障模式不同。如果焊接點在 85°C 下因熱疲勞而失效，在 105°C 下因氧化而失效，加速測試對於現場壽命沒有告訴你任何有用的信息。

香農的建議適用：校準——理解你的測量實際測量的是什麼——是關鍵步驟。加速測試只有在故障模式相同時才能校準溫度與故障率的關係。驗證這一點需要進行單獨的研究。

設計壽命測試

你是一位醫療設備可靠性工程師，該設備被植入人體。它必須持續 10 年（87,600 小時）。你的實驗室預算允許 6 個月的測試（4,380 小時）。設備在體溫（37°C）下運作。

簡單地在 50°C 或 60°C 下運行加速測試並外推以預測 10 年可靠性的根本問題是什麼？描述加速測試可能錯過或誤述的至少兩種具體故障模式，並解釋你將收集什麼額外證據來驗證外推。