un — Геометрія комп'ютерних додатків

un

гість

1 / ?

Виведення логістичного рівняння

S-крива Хеммінга має точне математичне виведення. Почніть з двох спостережень про впровадження технології:

1. Швидкість впровадження прискорюється з поточним впровадженням (передача від вуст до вуст, мережеві ефекти): dP/dt ∝ P

2. Швидкість впровадження сповільнюється, коли ринок насичується: dP/dt ∝ (1 − P)

Об'єднуємо: dP/dt = r · P · (1 − P)

Це логістичне диференціальне рівняння. Це рівняння з розділяючимися змінними: розкладання на прості дроби дозволяє прямое інтегрування.

Виведення

Розділяємо змінні: dP / [P(1−P)] = r dt

Прості дроби: 1/[P(1−P)] = 1/P + 1/(1−P)

Інтегруємо обидві сторони: ln(P) − ln(1−P) = rt + C

ln[P/(1−P)] = rt + C

P/(1−P) = e^(rt+C) = e^C · e^(rt)

Нехай K = e^C. Розв'яжемо відносно P: P = K·e^(rt) / (1 + K·e^(rt))

Еквівалентно: P(t) = 1 / (1 + e^(−r(t − t₀)))

де t₀ = (ln K)/r - точка перегину.

Точка перегину

У t = t₀: P = 0,5. Друга похідна d²P/dt² = 0: темп зростання максимальний. До t₀: увігнута вверх (прискорення). Після t₀: увігнута вниз (сповільнення).

Геометрія комп'ютерних додатків: Меткалфа & Ландшафт оптимізації

Підгонка логістичної кривої до даних

Враховуючи дві точки даних на логістичній кривій, ви можете розв'язати як r, так і t₀.

Впровадження інтернету: P(1995) = 0,01 (1% домогосподарств США), P(2005) = 0,70 (70%).

Використовуючи P(t) = 1/(1 + e^(−r(t−t₀))), складіть два рівняння з точок даних P(1995)=0,01 і P(2005)=0,70. З P(2005)=0,70: обчисліть t₀ за допомогою ln[P/(1−P)] = r(t−t₀). Потім використайте обидва рівняння, щоб розв'язати r. Покажіть всю алгебру. Що ваше значення r передбачає для P(2010)?

Вартість мережі як геометричний підрахунок

Хеммінг відзначив, що застосування керували впровадженням обчислень більше, ніж апаратне або програмне забезпечення. Мережезалежні застосування відповідають певній моделі зростання: їхня вартість зростає швидше, ніж їхні витрати.

Закон Меткалфа

Вартість мережі з n користувачів пропорційна кількості можливих з'єднань між користувачами:

V(n) = k · n(n−1)/2 ≈ k · n²/2 (для великих n)

де k - вартість одного з'єднання. Вартість мережі: C(n) ∝ n (приблизно лінійно від кількості користувачів).

Співвідношення вартості до витрат: V/C ∝ n²/n = n. Зі зростанням n, співвідношення зростає лінійно. Мережа з 10-кратною кількістю користувачів забезпечує приблизно 100-кратну вартість лише при 10-кратних витратах.

Геометрична картина

З n вузлів, кількість ребер в повному графі K_n дорівнює C(n,2) = n(n−1)/2. Це комбінаторна формула: вибрати 2 вузли з n. Для n=10: C(10,2)=45. Для n=100: C(100,2)=4950. Для n=1000: C(1000,2)=499500.

S-крива і Закон Меткалфа взаємодіють: під час фази 2 швидкого впровадження, n зростає швидко, а V(n) зростає як n². Точка перегину вартості відбувається перед точкою перегину впровадження — вартість прискорюється, випереджаючи впровадження, спонукаючи до подальшого впровадження в позитивному циклі зворотного зв'язку.

Вартість мережі на різних рівнях впровадження

Впровадження електронної пошти: у 1985 році (n=100 000 користувачів), k = $0,01 за з'єднання-рік. У 1995 році (n=30 000 000 користувачів).

Обчисліть V(1985) = k · n(n−1)/2 і V(1995) = k · n(n−1)/2 за допомогою наведених значень. Який коефіцієнт V(1995)/V(1985)? Потім обчисліть коефіцієнт зростання користувачів n(1995)/n(1985). Що коефіцієнт зростання вартості до зростання користувачів розповідає вам про те, чому електронна пошта раптово стала незамінною на початку 1990-х років?

Оптимізація як геометрія

Розповідь Хеммінга про касету Boeing описує невдачу оптимізації з точним геометричним значенням. Оптимізація функції f(x) на ландшафті вимагає:

1. Чітко визначена функція f: мета (опір, вартість, час виходу на ринок)

2. Фіксований ландшафт: f обчислена в однаковому стані кожного разу

3. Градієнт: напрямок найстрімкішого покращення

Коли ландшафт змінюється між вимірюваннями, градієнт, який ви оцінюєте, може вказувати в напрямку, який більше не існує, коли ви робите наступний крок. Ви обчислюєте gradient(f₁), але крокуєте в ландшафту f₂.

Градієнтний спуск

Стандартний градієнтний спуск: x_{t+1} = x_t − α ∇f(x_t)

де α = розмір кроку (швидкість навчання), ∇f = вектор градієнта (часткові похідні).

Невдача Boeing: у момент часу t, команда вимірює f(x_t). У момент часу t+1, команда змінює x на x_t + Δx. Але спільна база даних також змінилась: f тепер f' ≠ f. Спостережена зміна: f'(x_t + Δx) − f(x_t). Це НЕ градієнт f — вона включає термін з зміни ландшафту.

Фантомний градієнт

Виміряна зміна = [f'(x+Δx) − f(x)] = [f(x+Δx) − f(x)] + [f'(x+Δx) − f(x+Δx)]

= істинний градієнт × Δx + зміна ландшафту

Якщо зміна ландшафту переважає: команда рухається до мінімуму в f', який є максимумом в f. Вони оптимізують неправильне — можливо, роблячи свій дизайн гіршим, поки вимірювання показують покращення.

Кількісна оцінка помилки фантомного градієнта

Команда оптимізує опір f(θ, s), де θ = кут крила, s = розмах. Істинний градієнт: ∂f/∂θ = −0,5 (опір зменшується з θ), ∂f/∂s = +0,3 (опір збільшується з s).

Інша команда одночасно зменшує вагу фюзеляжу, що змінює функцію опору: f' = f − 0,8. (Легший фюзеляж зменшує опір на 0,8 одиниці при всіх конфігураціях.)

Перша команда вимірює: f'(θ+Δθ, s) − f(θ, s) = [f(θ+Δθ, s) − 0,8] − f(θ, s) = −0,5·Δθ − 0,8.

Якщо перша команда встановлює Δθ = 1 (змінює кут крила на 1 одиницю), якою є виміряна зміна? На що вони це приписують? Яка фактична внесок їхної власної зміни кута крила проти фантомного внеску від зміни фюзеляжу? Покажіть арифметику та інтерпретуйте: чи може фантомний градієнт змусити команду припинити оптимізацію θ передчасно?