English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

gość
1 / ?
powrót do lekcji

Wyprowadzenie równania logistycznego

Krzywa S Hamminga ma precyzyjne matematyczne wyprowadzenie. Zacznij od dwóch obserwacji dotyczących adopcji technologii:

1. Tempo adopcji przyspiesza wraz z bieżącą adopcją (przekaz ustny, efekty sieciowe): dP/dt ∝ P

2. Tempo adopcji spowalnia wraz z nasyceniem rynku: dP/dt ∝ (1 − P)

Łącząc: dP/dt = r · P · (1 − P)

To jest logistyczne równanie różniczkowe. Jest separowalne: rozkład na ułamki cząstkowe pozwala na bezpośrednie całkowanie.

Wyprowadzenie

Rozdzielamy zmienne: dP / [P(1−P)] = r dt

Ułamki cząstkowe: 1/[P(1−P)] = 1/P + 1/(1−P)

Całkujemy obie strony: ln(P) − ln(1−P) = rt + C

ln[P/(1−P)] = rt + C

P/(1−P) = e^(rt+C) = e^C · e^(rt)

Niech K = e^C. Rozwiązując dla P: P = K·e^(rt) / (1 + K·e^(rt))

Równoważnie: P(t) = 1 / (1 + e^(−r(t − t₀)))

gdzie t₀ = (ln K)/r jest punktem przegięcia.

Punkt przegięcia

Przy t = t₀: P = 0.5. Druga pochodna d²P/dt² = 0: tempo wzrostu jest maksymalne. Przed t₀: wklęsłość ku górze (przyspieszanie). Po t₀: wklęsłość ku dołowi (zwalnianie).

Geometria aplikacji komputerowych: Metcalfe & krajobraz optymalizacji

Dopasowanie modelu logistycznego do danych

Mając dwa punkty danych na krzywej logistycznej, można wyznaczyć zarówno r, jak i t₀.

Adopcja internetu: P(1995) = 0.01 (1% gospodarstw domowych w USA), P(2005) = 0.70 (70%).

Korzystając z P(t) = 1/(1 + e^(−r(t−t₀))), utwórz dwa równania na podstawie punktów danych P(1995)=0.01 i P(2005)=0.70. Dla P(2005)=0.70: oblicz t₀ używając ln[P/(1−P)] = r(t−t₀). Następnie użyj obu równań do wyznaczenia r. Pokaż całą algebrę. Co twoja wartość r przewiduje dla P(2010)?

Wartość sieci jako zliczanie geometryczne

Hamming zauważył, że aplikacje napędzały adopcję komputerów bardziej niż sprzęt czy oprogramowanie. Aplikacje zależne od sieci podążają za konkretnym modelem wzrostu: ich wartość rośnie szybciej niż koszty.

Prawo Metcalfe'a

Wartość sieci z n użytkownikami jest proporcjonalna do liczby możliwych połączeń między użytkownikami:

V(n) = k · n(n−1)/2 ≈ k · n²/2 (dla dużego n)

gdzie k jest wartością jednego połączenia. Koszt sieci: C(n) ∝ n (w przybliżeniu liniowy względem liczby użytkowników).

Stosunek wartości do kosztu: V/C ∝ n²/n = n. Gdy n rośnie, stosunek rośnie liniowo. Sieć z 10-krotnie większą liczbą użytkowników dostarcza około 100-krotnie więcej wartości przy tylko 10-krotnie wyższym koszcie.

Obraz geometryczny

Dla n węzłów, liczba krawędzi w grafie pełnym K_n wynosi C(n,2) = n(n−1)/2. To wzór kombinatoryczny: wybierz 2 węzły spośród n. Dla n=10: C(10,2)=45. Dla n=100: C(100,2)=4950. Dla n=1000: C(1000,2)=499 500.

Krzywa S i prawo Metcalfe'a wzajemnie na siebie oddziałują: podczas szybkiej adopcji w Fazie 2, n rośnie szybko, a V(n) rośnie jak n². Punkt przegięcia wartości następuje przed punktem przegięcia adopcji — wartość przyspiesza przed adopcją, przyciągając więcej adopcji w pozytywnej pętli sprzężenia zwrotnego.

Wartość sieci przy różnych poziomach adopcji

Adopcja poczty e-mail: w 1985 roku (n=100 000 użytkowników), k = 0,01 USD za połączenie-rok. W 1995 roku (n=30 000 000 użytkowników).

Oblicz V(1985) = k · n(n−1)/2 i V(1995) = k · n(n−1)/2 używając podanych wartości. Jaki jest stosunek V(1995)/V(1985)? Następnie oblicz stosunek wzrostu użytkowników n(1995)/n(1985). Co stosunek wzrostu wartości do wzrostu liczby użytkowników mówi ci o tym, dlaczego poczta e-mail stała się tak nagle niezbędna na początku lat 90-tych?

Optymalizacja jako geometria

Historia Hamminga z taśmą Boeinga opisuje niepowodzenie optymalizacji z precyzyjnym znaczeniem geometrycznym. Optymalizacja funkcji f(x) na krajobrazie wymaga:

1. Dobrze zdefiniowanej funkcji f: cel (opór, koszt, czas wprowadzenia na rynek)

2. Stałego krajobrazu: f oceniana w tym samym stanie za każdym razem

3. Gradientu: kierunek najostrzejszej poprawy

Gdy krajobraz zmienia się między pomiarami, szacowany gradient może wskazywać kierunek, który nie istnieje już podczas kolejnego kroku. Obliczasz gradient(f₁), ale krokując w krajobrazie f₂.

Metoda gradientu prostego

Standardowy gradient descent: x_{t+1} = x_t − α ∇f(x_t)

gdzie α = rozmiar kroku (współczynnik uczenia), ∇f = wektor gradientu (pochodne cząstkowe).

Niepowodzenie Boeinga: w czasie t, zespół mierzy f(x_t). W czasie t+1, zespół zmienia x na x_t + Δx. Ale wspólna baza danych również się zmieniła: f jest teraz f' ≠ f. Obserwowana zmiana: f'(x_t + Δx) − f(x_t). To NIE jest gradient f — zawiera składnik z przesunięcia krajobrazu.

Fantomowy gradient

Zmierzona zmiana = [f'(x+Δx) − f(x)] = [f(x+Δx) − f(x)] + [f'(x+Δx) − f(x+Δx)]

= prawdziwy gradient × Δx + przesunięcie krajobrazu

Jeśli przesunięcie krajobrazu dominuje: zespół zmierza ku minimum w f', które jest maksimum w f. Optymalizują niewłaściwą rzecz — możliwe, że pogarszają projekt, podczas gdy pomiary wskazują poprawę.

Kwantyfikowanie błędu fantomowego gradientu

Zespół optymalizuje opór f(θ, s), gdzie θ = kąt skrzydła, s = rozpiętość. Prawdziwy gradient: ∂f/∂θ = −0.5 (opór maleje z θ), ∂f/∂s = +0.3 (opór rośnie z s).

Inny zespół jednocześnie redukuje masę kadłuba, co zmienia funkcję oporu: f' = f − 0.8. (Lżejszy kadłub zmniejsza opór o 0.8 jednostki we wszystkich konfiguracjach.)

Pierwszy zespół mierzy: f'(θ+Δθ, s) − f(θ, s) = [f(θ+Δθ, s) − 0.8] − f(θ, s) = −0.5·Δθ − 0.8.

Jeśli pierwszy zespół ustawi Δθ = 1 (zmieni kąt skrzydła o 1 jednostkę), jaka jest zmierzona zmiana? Czemu ją przypisują? Jaki jest rzeczywisty wkład własnej zmiany kąta skrzydła w porównaniu do fantomowego wkładu ze zmiany kadłuba? Pokaż obliczenia i zinterpretuj: czy fantomowy gradient może spowodować, że zespół przedwcześnie przestanie optymalizować θ?