un — Geometria Symulacji II: Ważność Modelu jako Dopasowanie Geometryczne

un

gość

1 / ?

powrót do lekcji

Co Naprawdę Oznacza Dopasowanie Modelu

Model symulacji zawiera twierdzenie matematyczne: wyniki rzeczywistego systemu leżą na (lub blisko) określonej powierzchni M w przestrzeni obserwacji.

Niech rzeczywisty system generuje obserwacje y₁, y₂, ..., yₙ. Model przewiduje wartości ŷ₁, ŷ₂, ..., ŷₙ.

Reszty jako odległości: rᵢ = yᵢ - ŷᵢ. Każda reszta mierzy odległość między obserwacją a odpowiadającą jej prognozą modelu. W n-wymiarowej przestrzeni obserwacji reszty tworzą wektor r = y - ŷ.

Dopasowanie metodą najmniejszych kwadratów: wybierz parametry modelu, aby zminimalizować ||r||² = Σrᵢ². Geometrycznie, znajdź punkt ŷ na powierzchni modelu M najbliższy wektorowi obserwacji y w odległości euklidesowej.

Kiedy Reszty Wprowadzają w Błąd

Małe ||r||² nie gwarantuje ważnego modelu. Dwa systematyczne tryby awarii:

1. Błąd systematyczny: reszty rᵢ są małe, ale wszystkie dodatnie (lub wszystkie ujemne). Model konsekwentnie niedowartościowuje lub przepowiada zbyt dużo. Geometrycznie: ŷ leży na równoległej powierzchni przesunięcia do rzeczywistej rozmaitości danych — bliska odległościowo, błędna strukturalnie.

2. Błędna rozmaitość: reszty są małe, ponieważ model ma wystarczającą liczbę parametrów swobodnych, aby dokładnie dopasować dane treningowe (nadmierne dopasowanie). Powierzchnia modelu przechodzi przez punkty danych, ale krzywa się gwałtownie między nimi. Prognozy dla nowych danych są słabe.

Reszty, Błąd Systematyczny, & Dopasowanie Rozmaitości

Detekcja Błędu Systematycznego

Model z zerową średnią resztą może wciąż mieć błąd systematyczny, który zmienia się wraz ze zmienną wejściową.

Przykład: symulacja pogody, która niedocenia temperaturę o 2°C latem i przeszacowuje o 2°C zimą, ma średnią resztę ≈ 0 w ciągu pełnego roku, ale wyraźny błąd sezonowy.

Diagnostyka reszt: wykreśl rᵢ względem każdej zmiennej wejściowej. Płaski wzór (bez trendu) sugeruje brak błędu systematycznego z tej zmiennej. Wzór trendu ujawnia brakujący wymiar w modelu.

Pytanie walidacyjne Hamminga — 'Czy mały, ale krytyczny efekt mógłby być pominięty?' — przekłada się geometrycznie: czy wektor reszt ma składnik w kierunku niezawartym w przestrzeni parametrów modelu?

Model regresji y = ax + b dopasowuje się do 4 punktów danych: (1, 3), (2, 5), (3, 8), (4, 9). Dopasowana linia ma a = 2, b = 1, dając prognozy ŷ = (3, 5, 7, 9). Oblicz reszty. Potem: czy reszty są systematyczne (czy pokazują wzór), czy wyglądają losowo? Jaką geometryczną właściwość modelu zrewidowałbyś na podstawie wzoru reszt?

Błąd Systematyczny vs Szum Losowy

Efekt Hawthorne'a: osoby biorące udział w badaniu zmieniają zachowanie, ponieważ wiedzą, że są obserwowane, nie zaś z powodu eksperymentalnego zabiegu.

Interpretacja Geometryczna

Niech rzeczywista rozmaitość danych M żyje w przestrzeni rozpietej przez zmienne (x₁, x₂, ..., xₖ, observation_context).

Model ignoruje observation_context. Dopasowuje powierzchnię do obserwacji wyłącznie w (x₁, ..., xₖ).

Gdy observation_context = 'badanie', rzeczywiste punkty danych przesuwają się wzdłuż osi observation_context. Powierzchnia modelu — ustalona w przestrzeni (x₁, ..., xₖ) — teraz dopasowuje się do przesunętych danych. Reszty wydają się małe (powierzchnia wciąż dopasowuje się dobrze w kontekście badania), ale prognozy w niezobserowanym kontekście są systematycznie błędne.

Geometria: powierzchnia modelu jest bliska rozmaitości danych w kontekście badania, ale daleka od rozmaitości rzeczywistości. Odległość między nimi: przesunięcie Hawthorne'a wzdłuż osi observation_context.

Wymóg podwójnie ślepi Hamminga: uniemożliwić observation_context korelowanie się z zabiegiem. To utrzymuje rozmaitość rzeczywistości i rozmaitość danych w kontekście badania zbieżne — eliminuje przesunięcie geometryczne.

Inne Efekty Ukrytego Wymiaru

Każda zmienna, która wpływa na system, ale jest wykluczona z modelu, tworzy tę samą strukturę geometryczną:

- Efekty sezonowe pominięte w modelach ekonomicznych

- Zachowanie operatora wykluczone z symulacji produkcyjnych

- Stan wersji oprogramowania nieobecny w modelach wydajności

Model dopasowuje powierzchnię niższej wymiarowości do danych, które żyją na rozmaitości wyższej wymiarowości. Reszty będą małe w kierunkach, które model mierzy, duże w kierunkach niezmierzonych.

Walidacja jako Wyrównanie Geometryczne

Lista kontrolna walidacji Hamminga, przeformułowana jako geometria:

Czy teoria tła wspiera założone prawa? Czy wymiary przestrzeni parametrów modelu obejmują rzeczywistą rozmaitość danych? Jeśli brakuje kluczowych zmiennych (wykluczone wymiary), powierzchnia modelu nie może być wyrównana z rzeczywistością.

Czy dostępne są kontrole wewnętrzne? Prawa zachowania to ograniczenia geometryczne: dane muszą leżeć na określonej podrozmaitości definiowanej przez zachowanie masy, zachowanie energii itp. Jeśli symulacja narusza te, jej trajektoria opuściła ważną podrozmaitość.

Krzyżowe kontrole względem znanego doświadczenia z przeszłości: powierzchnia modelu musi przechodzić przez historyczne punkty walidacyjne — nie tylko dopasowuje dane treningowe, ale generalizuje do obserwacji spoza próby.

Czy symulacja jest stabilna? Stabilna symulacja pozostaje bliska rzeczywistej rozmaitości rozwiązania pomimo małych zaburzeń. Niestabilna symulacja opuszcza sąsiedztwo rozmaitości i nie można jej nazwać ważnym modelem.

Hamming zauważył, że w symulacjach biznesowych i grach wojennych, uczestnicy, którzy wiedzą, że są w symulacji, zmieniają zachowanie — czyniąc symulację nieinformacyjnym modelem rzeczywistego zachowania. Zidentyfikuj geometryczną właściwość, która powoduje awarię symulacji w tym przypadku (nie tylko 'efekt Hawthorne'a' — opisz strukturę geometryczną). Następnie zaproponuj test walidacyjny, który byłby w stanie wykryć lukę między symulacją a rzeczywistością bez konieczności stosowania warunków podwójnie ślepych.

Kiedy Prognoza Staje się Projekcją

Hamming popierał metodę scenariuszową dla dziedzin, w których prognoza jest niemożliwa: zamiast twierdzić 'system będzie robić X,' przedstaw zbiór możliwych trajektorii w różnych zestawach założeń.

Interpretacja Geometryczna

Powierzchnia modelu M(θ) zależy od parametrów θ (założenia o prawach, stałych, warunkach brzegowych). Różne zestawy założeń θ₁, θ₂, ..., θₖ definiują różne powierzchnie M(θ₁), ..., M(θₖ).

Koperta scenariusza to suma tych powierzchni: region przestrzeni wyjściowej, które którykolwiek z modeli scenariusza mógłby generować.

Pojedyncza prognoza twierdzi: rzeczywisty wynik leży blisko M(θ) dla najlepszego oszacowania θ. Metoda scenariusza twierdzi: rzeczywisty wynik leży gdzieś wewnątrz koperty.

Kiedy Koperta Jest Przydatna

Jeśli koperta jest wąska — wszystkie scenariusze zgadzają się na wyjściu pomimo różnych założeń — zaufanie do prognozy jest wysokie. Jeśli koperta jest szeroka — różne założenia generują bardzo różne wyjścia — model jest bardzo wrażliwy na założenia. Ta wrażliwość to wynik, nie tryb awarii.

Twierdzenie Hamminga o jego własnych prognozach: dawał scenariusze, nie dokładne prognozy. Przyszłość, którą opisał, to 'co prawdopodobnie się stanie, moim zdaniem,' nie precyzyjna prognoza.

Nakładanie się z Rzeczywistością

Model scenariuszowy jest walidowany, gdy rzeczywistość mieści się wewnątrz koperty. To słabszy test niż prognoza punktowa, ale bardziej szczery na temat tego, co model może twierdzić.

Zestawienie: Ważne Modele & Ich Geometria

Geometria ważnej symulacji sprowadza się do trzech wyrównań:

1. Przestrzeń parametrów obejmuje rzeczywistą rozmaitość: wymiary modelu obejmują wszystkie zmienne, które napędzają system. Luki w wymiarach ukrytych generują systematyczne przesunięcia.

2. Stabilność utrzymuje trajektorię bliska rzeczywistej rozmaitości: zbieżne pole kierunkowe oznacza, że błędy kurczą się. Rozbieżne pole oznacza, że symulacja opuszcza ważny region.

3. Reszty są małe I nieustrukturyzowane: losowe, nieskorelowane reszty sugerują, że model przechwytuje rzeczywistą rozmaitość. Ustrukturyzowane reszty (trendy, wzory) sygnalizują brakujący wymiar.

Pytanie Hamminga 'Dlaczego ktokolwiek powinien wierzyć symulacji?' przekłada się geometrycznie: jak bliska jest powierzchnia modelu rozmaitości rzeczywistości, w ilu wymiarach, z jaką stabilnością, walidowana na ilu punktach spoza próby?

Budujesz model do przewidywania, czy projekt konstrukcji mostu zakończy się zgodnie z harmonogramem. Twój model używa: planowanego czasu trwania (tygodnie), wielkości zespołu (osoby) i wskaźnika budżetu (rzeczywisty/planowany). Kolega twierdzi, że brakuje ci krytycznych zmiennych. Korzystając z ramy geometrycznej z tej lekcji, opisz dwa typy brakujących zmiennych: jeden, który byłby generować błędy systematyczne w prognozach, i jeden, który zwiększyłby wariancję prognozy bez błędu. Wyjaśnij geometryczną różnicę między tymi dwoma efektami.