Średnia, Wariancja i Obciążenie
Każdy pomiar x_i rzeczywistej wartości μ można zapisać jako: x_i = μ + β + ε_i, gdzie β jest błędem systematycznym (obciążeniem, stałym dla wszystkich pomiarów), a ε_i jest błędem losowym (różnym dla każdego pomiaru, pochodzącym z rozkładu ze średnią 0).
Błąd losowy: E[ε_i] = 0, Var[ε_i] = σ². Średnia próby x̄ = (1/n) Σ x_i ma wartość oczekiwaną μ + β i wariancję σ²/n. Gdy n → ∞, x̄ → μ + β (nie μ). Błąd losowy zbliża się do zera; obciążenie nie.
Błąd systematyczny: β ≠ 0, stały. Średnia z dowolnej liczby pomiarów to μ + β. Aby usunąć obciążenie, potrzebna jest kalibracja (niezależny pomiar β), a nie więcej powtórzeń.
Geometrycznie: wyobraź sobie rozkład pomiarów jako krzywą dzwonową. Błąd losowy kontroluje szerokość (wariancję). Błąd systematyczny kontroluje położenie środka (średnia jest przesunięta od rzeczywistej wartości o β).
Podana niepewność pomiaru jest zwykle oszacowaniem σ (tylko błąd losowy). Jeśli β jest duże i niewykryte, podana niepewność jest bezużyteczna — określa szum w obciążonym instrumencie.
Obliczenie Obciążenia vs Wariancji
Laboratorium mierzy stałą grawitacyjną g. Ich instrument ma błąd kalibracji systematycznej β = +0,05 m/s². Ich losowy błąd pomiarowy ma odchylenie standardowe σ = 0,02 m/s². Dokonują n = 100 pomiarów.
Rzeczywista wartość: g = 9,80 m/s².
Jak Błędy Przechodzą Przez Obliczenia
Gdy obliczasz wielkość z = f(x, y) z mierzonych wielkości x i y, ich błędy pomiarowe propagują się do z.
Wzór propagacji błędu (rozwinięcie Taylora pierwszego rzędu):
σ²_z ≈ (∂f/∂x)² σ²_x + (∂f/∂y)² σ²_y
(Zakłada to, że błędy x i y są niezależne. Jeśli są skorelowane, dodaj 2 · (∂f/∂x)(∂f/∂y) · Cov(x,y).)
Kluczowa idea: pochodne cząstkowe działają jako wzmacniacze. Jeśli ∂f/∂x jest duże, małe błędy w x dają duże błędy w z.
Oznacza to, że wybór metody obliczeniowej, która minimalizuje pochodne cząstkowe, jest rzeczywistym celem inżynieryjnym — nie tylko wygodą algorytmiczną. Hamming był akutnie tego świadomy w swojej pracy nad analizą numeryczną.
Propagacja Przez Iloczyn
Mierzysz dwie długości: L₁ = 10,0 m ± 0,1 m (σ₁ = 0,1) i L₂ = 5,0 m ± 0,2 m (σ₂ = 0,2). Obliczasz pole A = L₁ × L₂.
Gdy Dane Pasują Zbyt Dobrze
Test dobroci dopasowania chi-kwadrat: mając n obserwacji O_i i przewidywania modelu E_i, oblicz:
χ² = Σ (O_i − E_i)² / E_i
Jeśli model jest poprawny i pomiary mają wariancję E_i, oczekiwana wartość χ² wynosi około ν = (liczba punktów danych) − (liczba dopasowanych parametrów), zwane stopniami swobody.
Zredukowany chi-kwadrat χ²/ν powinien wynosić około 1,0, jeśli dane pasują do modelu z oczekiwanym rozrzutem.
- χ²/ν >> 1: dane zmieniają się bardziej niż oczekiwane — model jest błędny lub niepewności są niedoszacowane.
- χ²/ν << 1: dane zmieniają się mniej niż oczekiwane — podejrzanie czyste.
Podejrzany przypadek: jeśli twoje pomiary mają σ = 0,1, ale wszystkie dane spadają w obręb ±0,01 od krzywej modelu, ktoś selektywnie zachował 'dobre' pomiary. To błąd potwierdzenia: odrzucanie danych, które się nie zgadzają, i zatrzymywanie danych, które się zgadzają.
Hamming przytacza eksperyment z kroplą oleju Millikana: pomiar Nagrody Nobla stałej elektronowej. Późniejsza analiza notatników laboratoryjnych Millikana ujawniła, że zastosował niezarejestrowaną ocenę do odrzucenia pomiarów 'odstających' — a zatrzymane pomiary pasowały podejrzanie dobrze.
Oblicz i Zinterpretuj Zredukowany Chi-Kwadrat
Student dopasowuje model liniowy y = ax + b do 10 punktów danych, szacując 2 parametry (a i b). Podana niepewność pomiarowa dla każdego punktu to σ = 0,5. Reszty (O_i − E_i) z dopasowania to: 0,08, −0,12, 0,05, −0,09, 0,11, −0,07, 0,04, −0,03, 0,10, −0,06.