English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

khách
1 / ?
trở lại bài học

Cặp Dữ Liệu Của Nhà Thống Kê

Hamming mở Chương 27 bằng một câu chuyện. Một người bạn thống kê tại Bell Labs nghi ngờ rằng các phép đo trong một nghiên cứu không chính xác. Anh ta tranh cãi với trưởng bộ phận, người từ chối đo lại — 'các dụng cụ có nhãn bằng đồng trên chúng cho rằng chúng có độ chính xác đó, và những người của tôi đáng tin cậy.'

Vào thứ Hai, nhà thống kê đến và nói rằng anh ta đã để lại cặp dữ liệu trên tàu và mất hết dữ liệu của mình. Không có gì để làm ngoài việc đo lại. Khi các phép đo mới đến, nhà thống kê đã xuất hiện các bản ghi gốc — cho thấy chúng sai lệch bao nhiêu. Anh ta không được ưa chuộng vì động thái này, nhưng tính không chính xác giờ đây là không thể phủ nhận.

Hamming rút ra bài học khó khăn hơn từ một trường hợp khác: một nghiên cứu về các mẫu cuộc gọi điện thoại, được ghi lại bởi cùng một thiết bị tổng đài trung tâm đã thực hiện các cuộc gọi. Một ngày, nhà thống kê nhận thấy một cuộc gọi được tính phí cho một tổng đài trung tâm không tồn tại. Nhìn sâu hơn, anh ta phát hiện ra một tỷ lệ lớn các cuộc gọi đang kết nối — trong một số phút — với các tổng đài trung tâm không tồn tại. Máy đang tạo ra dữ liệu tệ hại về hoạt động của chính nó. Bạn không thể tin tưởng một máy để thu thập dữ liệu về chính nó một cách chính xác.

Ví dụ thứ ba của anh ta: anh trai của anh ta tại phòng Ô nhiễm không khí Los Angeles, người phải tháo rời, lắp ráp lại, và hiệu chuẩn lại mọi dụng cụ mới họ nhận được, bất kể những tuyên bố của nhà sản xuất.

Quy tắc của Hamming: luôn kiểm tra dữ liệu cẩn thận trước khi xử lý. Vẽ biểu đồ. Tìm kiếm các mẫu không nên có. Kiểm tra sự không nhất quán. Bất kể câu trả lời khẩn cấp đến mức nào, hãy kiểm tra dữ liệu trước tiên.

Sai Số Ngẫu Nhiên, Sai Số Hệ Thống & Chuỗi Hiệu Chuẩn

Kiểm Tra Dữ Liệu Trước

Nghiên cứu hàng tồn kho của Hamming: anh ấy đã nhận được 18 tháng hàng tồn kho cho khoảng 100 mục và ngây thơ tin lời đảm bảo của nhà cung cấp rằng các mâu thuẫn đã bị loại bỏ. Muộn trong dự án, anh ấy tìm thấy các mâu thuẫn còn lại — các mục không thể xảy ra mà không có lỗi (ví dụ: rút hàng từ hàng tồn kho trống).

Anh ấy kết luận: 'Tôi trước tiên phải tìm thấy chúng, sau đó loại bỏ chúng, và sau đó chạy dữ liệu lại. Từ kinh nghiệm đó tôi đã học được không bao giờ xử lý bất kỳ dữ liệu nào cho đến khi tôi đã kiểm tra nó cẩn thận để tìm lỗi.'

Mô tả ba kiểm tra tính nhất quán cụ thể mà bạn sẽ áp dụng cho một tập dữ liệu mới trước khi tin tưởng nó để phân tích. Đối với mỗi kiểm tra, giải thích loại lỗi nó sẽ bắt được — và tại sao loại lỗi đó có thể tồn tại trong dữ liệu mặc dù có những lời đảm bảo của nhà cung cấp.

Hai Loại Sai Số

Mỗi phép đo vật lý mang theo hai loại sai số:

Sai số ngẫu nhiên: biến thể không thể đoán trước được quanh giá trị đúng. Nó tuân theo một phân bố (thường xấp xỉ Gaussian) tập trung vào giá trị đúng. Các sai số ngẫu nhiên triệt tiêu khi lấy trung bình: lấy đủ nhiều phép đo và giá trị trung bình tiến gần đến giá trị đúng.

Sai số hệ thống (độ lệch): một sai lệch nhất quán theo một hướng. Tất cả các phép đo của bạn đều bị dịch chuyển cùng một lượng. Không có lượng lấy trung bình nào loại bỏ nó, bởi vì giá trị trung bình của nhiều phép đo bị sai lệch vẫn còn bị sai lệch.

Ví dụ của Hamming từ vật lý: một bảng của 10 hằng số cơ bản (tốc độ ánh sáng, số Avogadro, điện tích electron, v.v.) đã được biên dịch, và sau đó biên dịch lại 24 năm sau với các dụng cụ được cải thiện. Trung bình, các giá trị mới rơi 5.267 lần bên ngoài các thanh lỗi được nêu cũ. Điều này không hợp lý từ sai số ngẫu nhiên một mình — các sai số ngẫu nhiên lớn như vậy sẽ có thể phát hiện được. Giải thích: các dụng cụ cũ có sai số hệ thống không được ghi lại trong độ không chắc chắn được nêu, và chính các kỹ thuật đã có khiếm khuyết chung được thông qua cộng đồng.

Nhận xét của Shannon: 'Hiệu chuẩn là điều quan trọng nhất trong phép đo.' Hiệu chuẩn giải quyết sai số hệ thống. Nếu dụng cụ của bạn liên tục đọc cao hơn 3%, không có lượng phép đo lặp lại nào sửa được — bạn phải hiệu chuẩn.

Xác Định Sai Số Hệ Thống

Hằng số Hubble: tốc độ giãn nở của vũ trụ, được đo từ mối quan hệ chuyển dịch đỏ-khoảng cách của các thiên hà. Nhiều nhóm độc lập đã đo nó trong 50 năm qua. Theo lịch sử, nhiều giá trị được công bố đã rơi ngoài thanh lỗi của các giá trị được công bố khác — có nghĩa là sự không đồng ý lớn hơn các lỗi được nêu dự đoán.

Giải thích tại sao các phép đo độc lập của hằng số Hubble có thể mỗi cái có sai số ngẫu nhiên được nêu nhỏ nhưng vẫn không đồng ý theo lượng lớn hơn những sai số đó. Loại sai số nào gây ra mẫu này, và bạn sẽ phân biệt nó với sai số ngẫu nhiên một cách thực nghiệm như thế nào?

Làm Thế Nào Bạn Kiểm Tra Những Gì Bạn Không Thể Kiểm Tra?

Hamming đặt ra một vấn đề không có giải pháp sạch sẽ, nhưng mà mỗi kỹ sư thực hành cuối cùng phải đối mặt: Làm thế nào bạn kiểm tra độ tin cậy của một thiết bị khi chính kiểm tra đó mất thời gian lâu hơn bạn có, và thiết bị kiểm tra của bạn kém tin cậy hơn thiết bị bạn đang kiểm tra?

Kịch bản: một thiết bị phải tồn tại 20 năm tại thực địa (175.000 giờ). Phòng kiểm tra tuổi thọ của bạn được xếp hạng cho 10.000 giờ hoạt động. Ngân sách khoảng thời gian kiểm tra của bạn là 3 tháng (khoảng 2.000 giờ). Thiết bị dự kiến sẽ phải đối mặt với nhiệt độ hoạt động lên tới 85°C tại thực địa.

Kiểm tra tăng tốc: chạy thiết bị ở 105°C và giả sử các lỗi xảy ra nhanh gấp 10 lần so với 85°C (một quy tắc kỹ thuật phổ biến). Sau đó 2.000 giờ ở 105°C 'đại diện' 20.000 giờ ở 85°C. Nhưng nó có đúng không?

Vấn đề: chế độ hỏng hóc ở 105°C có thể khác với chế độ hỏng hóc ở 85°C. Nếu các khớp hàn bị hỏng do mỏi nhiệt ở 85°C nhưng do oxy hóa ở 105°C, thì kiểm tra tăng tốc không cho bạn biết gì hữu ích về tuổi thọ tại thực địa.

Lời khuyên của Shannon áp dụng: hiệu chuẩn — hiểu rõ điều mà phép đo của bạn thực sự đo — là bước quan trọng. Kiểm tra tăng tốc chỉ hiệu chuẩn nhiệt độ so với tỷ lệ lỗi nếu chế độ hỏng hóc là như nhau. Xác minh điều này yêu cầu một nghiên cứu riêng.

Thiết Kế Một Kiểm Tra Tuổi Thọ

Bạn là một kỹ sư độ tin cậy cho một thiết bị y tế được cấy ghép vào cơ thể con người. Nó phải tồn tại 10 năm (87.600 giờ). Ngân sách phòng thí nghiệm của bạn cho phép 6 tháng kiểm tra (4.380 giờ). Thiết bị hoạt động ở nhiệt độ cơ thể (37°C).

Vấn đề cơ bản của việc chỉ chạy các bài kiểm tra tăng tốc ở 50°C hoặc 60°C và ngoại suy để dự đoán độ tin cậy 10 năm là gì? Mô tả ít nhất hai chế độ hỏng hóc cụ thể mà bài kiểm tra tăng tốc có thể bỏ sót hoặc hiểu lầm, và giải thích bằng chứng bổ sung nào bạn sẽ thu thập để xác nhân phép ngoại suy.