un — Hamming Bölüm 27: Güvenilmez Veriler

un

konuk

1 / ?

derslere geri dön

İstatistikçinin Çantası

Hamming Bölüm 27'yi bir hikaye ile başlatır. Bell Labs'teki istatistikçi bir arkadaş, bir çalışmadaki ölçümlerin yanlış olduğundan şüpheleniyordu. Departman müdürü ile tartışır ama müdür yeniden ölçümü reddeder — 'enstrümanların üzerinde ne kadar doğru olduklarını belirten pirinç etiketleri var ve benim insanlar güvenilirdir.'

Pazartesi günü istatistikçi gelir ve trenin içinde çantasını bıraktığını & tüm verilerini kaybettiğini söyler. Yapılacak başka bir şey yoktur: yeniden ölçüm yapmak gerekir. Yeni ölçümler geldiğinde, istatistikçi orijinal kayıtları çıkarır — ne kadar yanlış olduklarını göstererek. Bu hareket için popüler olmaz ama yanlışlık artık kuşkusuzdur.

Hamming başka bir durumdan daha sert bir ders öğrenir: telefon çağrısı desenlerinin incelenmesi, aynı merkez ofis tarafından kaydedilmekte. Bir gün istatistikçi var olmayan bir merkez ofisine faturalandırılan bir çağrı fark eder. İleri araştırma yapınca, birçok çağrının — birkaç dakika boyunca — var olmayan ofislere bağlanıyor olduğunu bulur. Makine, kendi operasyonları hakkında kötü veriler üretiyor. Bir makineye kendi operasyonları hakkında doğru veri toplamak için güvenemezsiniz.

Üçüncü örnek: Los Angeles Hava Kirliliği Departmanında çalışan kardeşi, aldıkları her yeni enstrümanı söküp, tekrar monte edip & kalibre etmenin gerekli olduğunu bulur — üretici iddialarından bağımsız olarak.

Hamming kuralı: verileri işlemeden önce her zaman dikkatle incelensin. Grafiğe döküp gözlemleyin. Olmayan desenleri arayın. Tutarsızlıkları kontrol edin. Cevap ne kadar acil olursa olsun, verileri önce test edin.

Rastgele Hata, Sistematik Hata & Kalibre Etme Zinciri

Verileri Önceden Test Etmek

Hamming'in envanter çalışması: yaklaşık 100 madde için 18 aylık envanter kayıtlarını alır & naif bir şekilde tedarikçinin tutarsızlıkların kaldırıldığı şeklindeki güvencesine inanır. Proje ileri aşamalarında, kalıntı tutarsızlıkları bulur — hata olmadan meydana gelemeyecek girdiler (örneğin, boş envanterden çekilişler).

Hamming'in sonucu: 'Bunları önce bulmalıydım, sonra yok etmeliyim, sonra tüm veriyi yeniden işlemeliyim. Bu deneyimden bir dersi tuttum: hiçbir zaman herhangi bir veriyi dikkatle hatalar için incelemeden işlememelidir.'

Analiz için bir veri seti güvenmeden önce uygulanacağınız üç spesifik tutarlılık kontrolü tanımlayın. Her kontrol için, ne tür bir hatayı yakalayacağını açıklayın — & bu tür hata, tedarikçinin güvencesine rağmen veride neden var olabilir?

İki Tür Hata

Her fiziksel ölçüm iki tür hata taşır:

Rastgele hata: gerçek değer etrafında tahmin edilemeyen değişim. Bir dağılım izler (genellikle yaklaşık Gaussian) gerçek değer üzerinde merkezlenmiş. Rastgele hatalar ortalamayla iptal olur: yeterince ölçüm alın & ortalama gerçek değere yaklaşır.

Sistematik hata (önyargı): bir yönde tutarlı bir kayma. Tüm ölçümleriniz aynı miktarla kaydırılmıştır. Hiçbir miktarda ortalama bunu kaldırmaz, çünkü birçok yanlı ölçümün ortalaması yine de yanlılıktır.

Hamming'in fiziğin örneği: 10 temel sabitin tablosu (ışık hızı, Avogadro sayısı, elektronun yükü, vb.) derlenmiş, sonra 24 yıl sonra geliştirilmiş enstrümanlarla yeniden derlenmiş. Ortalama olarak yeni değerler eski belirtilen hata çubuklarının 5.267 kez dışında düşmüştür. Bu yalnızca rastgele hatalardan makul değildir — bu büyüklükteki rastgele hatalar fark edilebilir olurdu. Açıklama: eski enstrümanlar belirtilen belirsizlikte yakalanmayan sistematik hatalara sahipti & teknikler topluluğun içinde iletilen ortak bir kusura sahipti.

Shannon'ın gözlemi: 'Kalibre etme ölçümde en önemli şeydir.' Kalibre etme sistematik hatayı giderir. Enstrümanınız sürekli %3 çok yüksek okuyorsa, hiçbir miktarda tekrarlanan ölçüm bunu düzeltmez — kalibre etmeniz gerekir.

Sistematik Hatayı Tanımlamak

Hubble sabiti: evrenin galaksiler redshift-mesafe ilişkisinden ölçülen genişleme hızı. Birden fazla bağımsız grup son 50 yılda bunu ölçmüştür. Tarihsel olarak, yayınlanan değerlerin çoğu diğer yayınlanan değerlerin hata çubuklarının dışında düşmüştür — anlamı anlaşmazlıklar belirtilen belirsizliklerin öngördüğünden daha büyüktür.

Hubble sabitinin bağımsız ölçümleri neden, her biri küçük belirtilen rastgele hatalara sahip olabiliyor ama yine de bu hataları tahmin ettiğinden daha büyük miktarlarda anlaşmazlığa sahip olabiliyor? Ne tür bir hata bu deseni neden olur & rastgele hatadan ayırt etmek için deneysel olarak ne yapardınız?

Test Edemeyeceğiniz Şeyi Nasıl Test Edersiniz?

Hamming temiz bir çözümü olmayan ama her pratik mühendis sonunda karşılaşan bir sorunu ortaya koyar: Testi kendisi alacak hızdan daha fazla süren bir cihazın güvenilirliğini, test ekipmanı test ettiğiniz cihazdan daha az güvenilir olduğu sürece, nasıl test edersiniz?

Senaryo: bir cihaz sahada 20 yıl dayanmalıdır (175.000 saat). Yaşam testi laboratuvarınız 10.000 saatlik operasyon için derecelendirilmiştir. Test süresi bütçesi 3 ay (yaklaşık 2.000 saat). Cihazın sahada 85°C'ye kadar çalışma sıcaklıklarıyla karşılaşması beklenmektedir.

Hızlandırılmış test: cihazı 105°C'de çalıştırın & 85°C'deki hataların 105°C'deki 10 kat daha hızlı meydana geldiğini varsayın (yaygın bir mühendislik kuralı-of-thumb). O zaman 105°C'de 2.000 saat 85°C'de 20.000 saati 'temsil eder'. Ama yapıyor mu?

Problem: 105°C'deki arıza modu 85°C'deki arıza modundan farklı olabilir. Lehim bağlantıları 85°C'de termal yorulmayla başarısız olur ama 105°C'de oksidasyonla başarısız olursa, hızlandırılmış test saha ömrü hakkında hiç bir şey söylemez.

Shannon'ın tavsiyesi geçerlidir: kalibre etme — ölçümünüzün aslında ne ölçtüğünü anlama — kritik adımdır. Hızlandırılmış test, ancak arıza modu aynıysa sıcaklığı hata oranına karşı kalibre eder. Bunu doğrulamak ayrı bir çalışma gerektirir.

Yaşam Testini Tasarla

İnsan vücuduna implante edilen tıbbi bir cihaz için güvenilirlik mühendisisisiniz. 10 yıl dayanmalıdır (87.600 saat). Laboratuvar bütçeniz 6 aylık test yapılmasını sağlar (4.380 saat). Cihaz vücut sıcaklığında (37°C) çalışır.

Hızlandırılmış testleri basitçe 50°C veya 60°C'de çalıştırıp 10 yıllık güvenilirliği tahmin etmeye çalışmanın temel sorunu nedir? Hızlandırılmış testin kaçırabileceği veya yanlış karakterize edebileceği en az iki spesifik arıza modunu tanımlayın & tahmininin geçerliliğini doğrulamak için ne ek kanıt toplayacağınızı açıklayın.