un

guest
1 / ?
back to lessons

Statistici'nin Çantası

Hamming 27. bölümü açıklamasıyla bir hikaye anlatıyor. Bell Labs'da bir istatistikçi arkadaşı, bir çalışmada ölçümlemenin hatalı olduğunu şüphelendi. Departman müdürü ile tartıştı, yeniden ölçüm yapmayı reddetti - 'aygıtların etiketleri onlardan o kadar doğru olduğunu söylüyor ve insanlar güvenilir.'

Pazartesi günü, istatistikçi geldi ve trende kalmış olduğunu ve tüm verilerini kaybettiğini söyledi. Sadece yeniden ölçüm yapabilecekleri ortaya çıktı. Yeni ölçüm sonuçları geldiğinde, istatistikçi orijinal kayıtları ortaya koydu - ne kadar yanlış olduğunu gösteriyor. Bu hamleyle popüler olmadı, ancak hatalılık artık inkar edilemez.

Hamming, başka bir olaydan daha sert bir ders çıkardı: telefon görüşmeleri kalıplaşması, aynı merkezi ofis ekipmanları tarafından kaydediliyordu. Bir gün, bir istatistikçi, bir var olmayan merkezi ofise fatura edilen bir görüşme fark etti. Daha da ileri gittiğinde, büyük bir kısmın, bir süreliğine - var olmayan ofislere bağlandığını keşfetti. Makine, kendi çalışmasını doğru bir şekilde toplayamayan kötü verilere sahipti. Bir makine, kendi hakkında doğru bir şekilde veri toplamak için güvenilmezdir.

Üçüncü örneği: Los Angeles Hava Kirliliği departmanındaki kardeşi, her yeni aletin teslim alındığında, üreticinin iddialarına rağmen, her zaman parçalara ayırarak, yeniden monte ederek ve yeniden kalibrasyon yaparak gerekli olduğu zaman her aleti yeniden ayarladı.

Hamming kuralı: veriyi işlemenin önce dikkatlice inceleyin. Grafikle gösterin. Olması gerekenler dışında desenler arayın. Uyuşmazlıklar için kontrol edin. Cevap ne kadar acil olursa olsun, veriyi önce test edin.

Rastgele Hata, Sistemik Hata ve Kalibrasyon Zinciri

Veriyi Önceden Test Et

Hamming'in stok çalışması: ~100 eşya için 18 aylık stok kayıtlarını aldı ve sağlayıcıların, tutarsızlıklar kaldırıldığını güvence altına aldığını naif olarak düşündü. Projenin sonunda, kalan tutarsızlıklar keşfetti - hata olmadan gerçekleşemeyen girişler (ör. Boş stoklardan çekmeler).

O sonuç şu oldu: 'İlk olarak onları bulmak, ardından onları ortadan kaldırmak ve sonra da verileri tekrar çalıştırmak zorundaydım. Bu deneyimden, veriyi dikkatlice hatalar için incelememiş olana kadar herhangi bir verinin işlenmeyeceğini öğrendim.'

Yeni bir veri kümesine güvendiğinizde analize güvenle kullanmadan önce, her bir kontrolü açıklar şekilde üç özel tutarlılık denetimi uygulayınız. Her kontrol için, hata türünü yakalayacağı ve sağlayıcının güvencesine rağmen veri kümesinde neden mevcut olabileceğini açıklar şekilde açıklayınız.

İki Tür Hata

Herhangi bir fiziksel ölçüm, iki tür hata taşır:

Rastgele hata: Gerçek değere göre belirsiz bir dalgalanma. Gerçek değerin etrafında bir dağılım izler (genellikle yaklaşık olarak Gauss). Rastgele hatalar ortalamaların kaldırılmasıyla silinir: yeterince ölçüm alırsanız, ortalama gerçek değere yaklaşır.

Sistemik hata (yay): Bir yönde sürekli bir eksiyan. Tüm ölçümleriniz aynı miktarla kayma gösterir. Ortalamaların kaldırılması hataları hâlâ yansıtılmış olur.

Fizikten Hamming örneği: 10 temel sablonun (ışık hızı, Avogadro sayısı, elektron şarjı vb.) bir tablosu derlendi ve daha iyi aletlerle 24 yıl sonra yeniden derlendi. Ortalama olarak yeni değerler, eski belirtilen hata aralıklarının dışına 5.267 kez çıktı. Bu, rastgele hatalardan yalnız plausibly - rastgele hatalar bu büyüklükte algılanabilir. Açıklama: Eski aletlerin hatalarını ifade etmeyen belirtilmiş belirsizliklere sahip olduğu ve tekniklerin de topluluk aracılığıyla paylaşılan bir kusur taşıdığı.

Shannon'ın yorumu: 'Kalibrasyon ölçmede en önemli şeydir.' Kalibrasyon sistematik hata ile ilgilidir. Elinizdeki alet sürekli %3 fazla okursa, tekrarlanan ölçümlemenin bu sorunu düzeltemez - kalibre etmeniz gerekir.

Sistemik Hata Tanım

Hubble sabiti: evrenin genişlemesi oranını, galaksilerin kırmızıshift-uzaklık ilişkisinden ölçülür. Son 50 yıl boyunca bu değeri farklı bağımsız gruplar ölçtü. Tarih boyunca, birçok yayınlanan değer, diğer yayınlanan değerlerin hata çubukları dışında kaldı - yani anlaşmazlıklar, öngörülen belirsizlikler dışında daha büyük oldu.

Bağımsız Hubble sabiti ölçümlerinin her birinin küçük ifade edilmiş rastgele hataları olmasına rağmen, bu hatalardan daha büyük anlaşmazlıklarla anlaşmazlık yaşayabileceklerini açıklayın. Bu desenin nedenini ve bu deseni rastgele hata denetimsel olarak nasıl ayırt edeceğinizi anlatın.

Ne Kadar Test Edersiniz?

Hamming, temiz bir çözüm olmadan bir soruna sahip olduğunu belirtiyor, ancak her uygulayan mühendis sonunda bu soruyla karşılaşıyor: Güvenilirlik için bir cihaz nasıl test edilirken, testin kendisinin daha az zamanınız olduğu sürece daha uzun sürüyor ve test ekipmanınızın test ettiğiniz cihazdan daha az güvenilir olduğu sürece?

Senaryo: Bir cihaz, sahada 20 yıl (175.000 saat) dayanmalıdır. Laboratuvarınız, çalıştırma süresi açısından 10.000 saate kadar çıkabilir. Test süresi bütçeniz 3 aydır (yaklaşık 2.000 saat). Cihaz, sahada 85°C'ye kadar işletme sıcaklığıyle karşı karşıya kalması bekleniyor.

Yüksek hızlı testler: Cihazı 105°C'ye çıkarmak ve 85°C'de 10 kat daha hızlı başarısızlık yaşanacağı (mühendislik kuralı) varsayarak çalıştırın. 2.000 saatlik 105°C testi, 85°C'deki 20.000 saatlik süreyi temsil eder mi?

Sorun: 105°C'deki başarısızlık modu, 85°C'deki başarısızlık modundan farklı olabilir. 85°C'de solder bağlantılarının termal fatiğiyle başarısız oluyorsa, 105°C'de oksidasyonla başarısızlık yaşanıyorsa, hızlandırılmış test, sahada ömür tahminine hiçbir şey söylemez.

Shannon'ın tavsiyesi uygulanır: Ölçmenin neyi ölçtüğüne dair kalibrasyon - anlama - kritik adımdır. Hızlandırılmış testler, başarısızlık modunun aynı olduğu sürece sıcaklık ve başarısızlık oranını karşılaştırır. Bu gerektiğinde ayrı bir çalışmayla doğrulanmalıdır.

Ömür Testi Tasarla

Size, insan vücudunda yerleştirilecek bir tıbbi cihazın güvenilirliğini değerlendiren güvenilirlik mühendisi olarak görevlendiriliyor. Cihaz, 10 yıl (87.600 saat) dayanmalıdır. Laboratuvar bütçenizi 6 aylik test süresi (4.380 saat) sağlar. Cihaz, vücut sıcaklığında (37°C) çalışır.

Sadece 50°C veya 60°C'de hızlandırılmış testler çalıştırarak ve 10 yıllık güvenilirliği tahmin etmek için bu testleri çıkarmaya dayalan temel sorun nedir? Hızlandırılmış testin kaçırabileceği veya yanlış karakterize edebileceği en az iki özel başarısızlık modunu açıklar ve bu çıkarmayı doğrulamak için toplanacak ek delil açıklar.