English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

gość
1 / ?
powrót do lekcji

Średnia, Wariancja i Obciążenie

Każdy pomiar x_i rzeczywistej wartości μ można zapisać jako: x_i = μ + β + ε_i, gdzie β jest błędem systematycznym (obciążeniem, stałym dla wszystkich pomiarów), a ε_i jest błędem losowym (różnym dla każdego pomiaru, pochodzącym z rozkładu ze średnią 0).

Błąd losowy: E[ε_i] = 0, Var[ε_i] = σ². Średnia próby x̄ = (1/n) Σ x_i ma wartość oczekiwaną μ + β i wariancję σ²/n. Gdy n → ∞, x̄ → μ + β (nie μ). Błąd losowy zbliża się do zera; obciążenie nie.

Błąd systematyczny: β ≠ 0, stały. Średnia z dowolnej liczby pomiarów to μ + β. Aby usunąć obciążenie, potrzebna jest kalibracja (niezależny pomiar β), a nie więcej powtórzeń.

Geometrycznie: wyobraź sobie rozkład pomiarów jako krzywą dzwonową. Błąd losowy kontroluje szerokość (wariancję). Błąd systematyczny kontroluje położenie środka (średnia jest przesunięta od rzeczywistej wartości o β).

Podana niepewność pomiaru jest zwykle oszacowaniem σ (tylko błąd losowy). Jeśli β jest duże i niewykryte, podana niepewność jest bezużyteczna — określa szum w obciążonym instrumencie.

Propagacja Błędu: Niepewność Przez Funkcje

Obliczenie Obciążenia vs Wariancji

Laboratorium mierzy stałą grawitacyjną g. Ich instrument ma błąd kalibracji systematycznej β = +0,05 m/s². Ich losowy błąd pomiarowy ma odchylenie standardowe σ = 0,02 m/s². Dokonują n = 100 pomiarów.

Rzeczywista wartość: g = 9,80 m/s².

Oblicz: (a) wartość oczekiwaną ich średniej próby x̄, (b) błąd standardowy ich średniej próby (niepewność w x̄ wynikająca tylko z błędu losowego), (c) przedział ufności 95%, który by zaraportować (zakładając, że nie są świadomi obciążenia), oraz (d) czy rzeczywista wartość mieści się w tym przedziale. Pokaż wszystkie obliczenia.

Jak Błędy Przechodzą Przez Obliczenia

Gdy obliczasz wielkość z = f(x, y) z mierzonych wielkości x i y, ich błędy pomiarowe propagują się do z.

Wzór propagacji błędu (rozwinięcie Taylora pierwszego rzędu):

σ²_z ≈ (∂f/∂x)² σ²_x + (∂f/∂y)² σ²_y

(Zakłada to, że błędy x i y są niezależne. Jeśli są skorelowane, dodaj 2 · (∂f/∂x)(∂f/∂y) · Cov(x,y).)

Kluczowa idea: pochodne cząstkowe działają jako wzmacniacze. Jeśli ∂f/∂x jest duże, małe błędy w x dają duże błędy w z.

Oznacza to, że wybór metody obliczeniowej, która minimalizuje pochodne cząstkowe, jest rzeczywistym celem inżynieryjnym — nie tylko wygodą algorytmiczną. Hamming był akutnie tego świadomy w swojej pracy nad analizą numeryczną.

Propagacja Przez Iloczyn

Mierzysz dwie długości: L₁ = 10,0 m ± 0,1 m (σ₁ = 0,1) i L₂ = 5,0 m ± 0,2 m (σ₂ = 0,2). Obliczasz pole A = L₁ × L₂.

Korzystając ze wzoru propagacji niepewności, oblicz: (a) wartość oczekiwaną A, (b) σ_A używając wzoru σ²_A = (∂A/∂L₁)² σ₁² + (∂A/∂L₂)² σ₂², oraz (c) niepewność względną σ_A/A. Pokaż, że niepewność względna w A równa się √[(σ₁/L₁)² + (σ₂/L₂)²]. Zweryfikuj to numerycznie.

Gdy Dane Pasują Zbyt Dobrze

Test dobroci dopasowania chi-kwadrat: mając n obserwacji O_i i przewidywania modelu E_i, oblicz:

χ² = Σ (O_i − E_i)² / E_i

Jeśli model jest poprawny i pomiary mają wariancję E_i, oczekiwana wartość χ² wynosi około ν = (liczba punktów danych) − (liczba dopasowanych parametrów), zwane stopniami swobody.

Zredukowany chi-kwadrat χ²/ν powinien wynosić około 1,0, jeśli dane pasują do modelu z oczekiwanym rozrzutem.

- χ²/ν >> 1: dane zmieniają się bardziej niż oczekiwane — model jest błędny lub niepewności są niedoszacowane.

- χ²/ν << 1: dane zmieniają się mniej niż oczekiwane — podejrzanie czyste.

Podejrzany przypadek: jeśli twoje pomiary mają σ = 0,1, ale wszystkie dane spadają w obręb ±0,01 od krzywej modelu, ktoś selektywnie zachował 'dobre' pomiary. To błąd potwierdzenia: odrzucanie danych, które się nie zgadzają, i zatrzymywanie danych, które się zgadzają.

Hamming przytacza eksperyment z kroplą oleju Millikana: pomiar Nagrody Nobla stałej elektronowej. Późniejsza analiza notatników laboratoryjnych Millikana ujawniła, że zastosował niezarejestrowaną ocenę do odrzucenia pomiarów 'odstających' — a zatrzymane pomiary pasowały podejrzanie dobrze.

Oblicz i Zinterpretuj Zredukowany Chi-Kwadrat

Student dopasowuje model liniowy y = ax + b do 10 punktów danych, szacując 2 parametry (a i b). Podana niepewność pomiarowa dla każdego punktu to σ = 0,5. Reszty (O_i − E_i) z dopasowania to: 0,08, −0,12, 0,05, −0,09, 0,11, −0,07, 0,04, −0,03, 0,10, −0,06.

Oblicz χ², stopnie swobody ν i zredukowany chi-kwadrat χ²/ν. Następnie zinterpretuj wynik: czy dane dopasowują się do modelu dobrze, źle czy podejrzanie dobrze? Co byś zrobił/zrobiła dalej jako analityk danych?