un

guest
1 / ?
back to lessons

Derewacja równania logistycznego

Krzywa Hamminga S ma dokładną matematyczna derewację. Zaczynaj od dwóch obserwacji o przyjęciu technologii:

1. Tempo przyjęcia przyspiesza wraz ze współczesnym przyjęciem (rozprzestrzenianie się informacji, efekty sieciowe): dP/dt ∝ P

2. Tempo przyjęcia zwalnia, gdy rynek się nasycza: dP/dt ∝ (1 − P)

Złącz: dP/dt = r · P · (1 − P)

To jest logistyczne równanie różniczkowe. Jest ono rozdzielane: dekompilacja części całkowych pozwala na bezpośrednie zintegrowanie.

Derewacja

Rozdziel zmiennych: dP / [P(1−P)] = r dt

Części całościowe: 1/[P(1−P)] = 1/P + 1/(1−P)

Zintegruj obie strony: ln(P) − ln(1−P) = rt + C

ln[P/(1−P)] = rt + C

P/(1−P) = e^(rt+C) = e^C · e^(rt)

Niech K = e^C. Rozwiąż dla P: P = K·e^(rt) / (1 + K·e^(rt))

Równolegle: P(t) = 1 / (1 + e^(−r(t − t₀)))

gdzie t₀ = (ln K)/r to punkt zwrotny.

Punkt Zwrotny

Na t = t₀: P = 0,5. Druga pochodna d²P/dt² = 0: tempo wzrostu jest maksymalne. Przed t₀: concave up (przyspieszające). Po t₀: concave down (zwalniające).

Computer Applications Geometry: Metcalfe & Optimization Landscape

Pasowanie logistyczne do danych

Dwa punkty danych na krzywej logistycznej można rozwiązać dla obu r i t₀.

Przyjęcie internetu: P(1995) = 0,01 (1% gospodarstw domowych w USA), P(2005) = 0,70 (70%).

Używając P(t) = 1/(1 + e^(−r(t−t₀))), zdefiniuj dwa równania z punktów danych P(1995)=0,01 i P(2005)=0,70. Z P(2005)=0,70: oblicz t₀ korzystając z ln[P/(1−P)] = r(t−t₀). Następnie użyj obu równań, aby rozwiązać r. Pokaż całą algebrę. Co Twoje r wartość przewiduje dla P(2010)?

Wartość Sieci jako Geometryczny Sposób Liczenia

Hamming zauważył, że aplikacje miały większy wpływ na przyjęcie technologii komputerowych niż sprzęt czy oprogramowanie. Aplikacje zależne od sieci mają określony wzorzec wzrostu: ich wartość rośnie szybciej niż koszty.

Prawo Metcalfe'a

Wartość sieci o n użytkownikach jest proporcjonalna do liczby możliwych połączeń między użytkownikami:

V(n) = k · n(n−1)/2 ≈ k · n²/2 (dla dużych n)

gdzie k to wartość jednego połączenia. Koszt sieci: C(n) ∝ n (ściśle liniowy w liczbie użytkowników).

Stosunek wartości do kosztu: V/C ∝ n²/n = n. W miarę jak n rośnie, stosunek rośnie liniowo. Sieć o 10x więcej użytkowników dostarcza około 100x więcej wartości za tylko 10x kosztu.

Geometryczne Obrazowanie

Z n węzłami, liczba krawędzi w grafie pełnym K_n to C(n,2) = n(n−1)/2. To kombinatoryczny wzór: wybór 2 węzłów z n. Dla n=10: C(10,2)=45. Dla n=100: C(100,2)=4950. Dla n=1000: C(1000,2)=499,500.

Krzywa S i Prawo Metcalfe'a się przecinają: w fazie 2 szybkiego przyjęcia, n rośnie szybko, a V(n) rośnie jako n². Przełom wartości występuje przed przełomem przyjęcia — wartość przyspiesza przed przyjęciem, przyciągając więcej przyjęć w pętli zwrotnej.

Wartość Sieci na Różnych Poziomach Przyjęcia

Przyjęcie poczty e-mail: w 1985 roku (n=100,000 użytkowników), k = $0.01 na połączenie-rok. W 1995 roku (n=30,000,000 użytkowników).

Oblicz V(1985) = k · n(n−1)/2 i V(1995) = k · n(n−1)/2, korzystając z podanych wartości. Jakie jest stosunek V(1995)/V(1985)? Następnie oblicz stosunek wzrostu użytkowników n(1995)/n(1985). Co mówi stosunek wzrostu wartości do wzrostu użytkowników o tym, dlaczego poczta stała się nieodłączna w latach 90. XX wieku?

Optymalizacja jako Geometria

Opowieść Boeinga Hamminga opisująca niepowodzenie optymalizacji ma dokładne znaczenie geometryczne. Optymalizacja funkcji f(x) na krajobrazie wymaga:

1. Zdefiniowanej funkcji f: cel (opór, koszt, czas rynku)

2. Stałego krajobrazu: f obliczanej w tym samym stanie każdorazowo

3. Współczynnika gradientu: kierunku największego poprawienia

Gdy krajobraz zmienia się między pomiarami, obliczony przez Ciebie współczynnik gradientu może wskazywać na kierunek, który już nie istnieje, gdy weździesz kolejny krok. Obliczasz gradient(f₁), ale krokujesz po krajobrazie f₂.

Spadek Gradientu

Standardowy spadek gradientu: x_{t+1} = x_t − α ∇f(x_t)

gdzie α = wielkość kroku (szybkość uczenia), ∇f = wektor gradientu (cząsteczki częściowe).

Porażka Boeinga: w czasie t, zespół mierzy f(x_t). W czasie t+1, zespół zmienia x na x_t + Δx. Ale baza danych udostępniona również się zmieniła: f teraz to f' ≠ f. Obserwowana zmiana: f'(x_t + Δx) − f(x_t). To NIE jest gradient f - zawiera on cząstkę od krajobrazu.

Fantomowy Współczynnik Gradientu

Pomierzone zmiany = [f'(x+Δx) − f(x)] = [f(x+Δx) − f(x)] + [f'(x+Δx) − f(x+Δx)]

= prawdziwy gradient × Δx + zmiana krajobrazu

Jeśli zmiana krajobrazu dominuje: zespół porusza się w kierunku minimum w f' , które jest maksimum w f. Optymalizują złe rzeczy - możliwe, że zepsują swój design, podczas gdy pomiar pokazuje poprawę.

Kwantyfikacja Błędu Fantomowego Współczynnika Gradientu

Zespół optymalizuje opór f(θ, s), gdzie θ to kąt skrzydła, s to rozpiętość. Prawdziwy gradient: ∂f/∂θ = −0.5 (opór maleje z θ), ∂f/∂s = +0.3 (opór rośnie z s).

Inny zespół jednocześnie redukuje ciężar kadłuba, co zmienia funkcję oporu: f' = f − 0.8. (Lżejszy kadłub redukuje opór o 0.8 jednostek dla wszystkich konfiguracji.)

Pierwszy zespół mierzy: f'(θ+Δθ, s) − f(θ, s) = [f(θ+Δθ, s) − 0.8] − f(θ, s) = −0.5·Δθ − 0.8.

Jeśli pierwszy zespół ustawi Δθ = 1 (zmieni kąt skrzydła o 1 jednostkę), jaka będzie zmierzona zmiana? Do czego przypisują ją? Jakie jest rzeczywiste wpływanie ich własnej zmiany kąta skrzydła w porównaniu z fikcyjnym wpływaniem związanych z zmianą kadłuba? Pokaż arytmetykę i interpretuj: czy fikcyjny gradient mógł spowodować, że zespół zatrzyma się zbyt wcześnie w optymalizacji θ?