un — 計算機應用的幾何

un

guest

1 / ?

back to lessons

邏輯方程的推導

Hamming的S曲線有一個精確的數學推導。從關於技術採納的兩個觀察開始：

1. 採納速率隨著當前採納而加速（口碑、網絡效應）：dP/dt ∝ P

2. 隨著市場飽和，採納速率減速：dP/dt ∝ (1 − P)

結合：dP/dt = r · P · (1 − P)

這是邏輯微分方程。它是可分的：部分分數分解允許直接積分。

推導

分離變數：dP / [P(1−P)] = r dt

部分分數：1/[P(1−P)] = 1/P + 1/(1−P)

對兩邊積分：ln(P) − ln(1−P) = rt + C

ln[P/(1−P)] = rt + C

P/(1−P) = e^(rt+C) = e^C · e^(rt)

令K = e^C。解出P：P = K·e^(rt) / (1 + K·e^(rt))

等價地：P(t) = 1 / (1 + e^(−r(t − t₀)))

其中t₀ = (ln K)/r是拐點。

拐點

在t = t₀處：P = 0.5。二階導數d²P/dt² = 0：增長率最大。在t₀之前：凹向上（加速）。在t₀之後：凹向下（減速）。

計算機應用幾何：梅特卡夫定律與最佳化景觀

將邏輯曲線擬合到數據

給定邏輯曲線上的兩個數據點，你可以解出r和t₀。

互聯網採納：P(1995) = 0.01（美國家庭的1%），P(2005) = 0.70（70%）。

使用P(t) = 1/(1 + e^(−r(t−t₀)))，從數據點P(1995)=0.01和P(2005)=0.70建立兩個方程。從P(2005)=0.70：使用ln[P/(1−P)] = r(t−t₀)計算t₀。然後使用兩個方程解出r。顯示所有代數步驟。你的r值對P(2010)預測了什麼？

作為幾何計數的網絡價值

Hamming指出，應用程序推動計算採納的程度遠超硬件或軟件。依賴網絡的應用程序遵循一個特定的增長模式：它們的價值增速快於成本。

梅特卡夫法則

具有n個用戶的網絡的價值與用戶之間可能的連接數成正比：

V(n) = k · n(n−1)/2 ≈ k · n²/2 （對於大型n）

其中k是一個連接的價值。網絡成本：C(n) ∝ n（粗略地說與用戶數成線性關係）。

價值成本比：V/C ∝ n²/n = n。當n增長時，比率呈線性增長。擁有10倍用戶的網絡提供約100倍的價值，但成本只有10倍。

幾何圖像

具有n個節點，完全圖K_n中的邊數是C(n,2) = n(n−1)/2。這是一個組合公式：從n個節點中選擇2個。對於n=10：C(10,2)=45。對於n=100：C(100,2)=4950。對於n=1000：C(1000,2)=499,500。

S曲線和梅特卡夫法則相互作用：在第2階段快速採納期間，n增長迅速，V(n)增長為n²。價值拐點出現早於採納拐點 — 價值在採納之前加速，形成正反饋循環，吸引更多採納。

不同採納水平的網絡價值

電子郵件採納：1985年（n=100,000個用戶），k = $0.01/連接年。1995年（n=30,000,000個用戶）。

使用給定的值計算V(1985) = k · n(n−1)/2和V(1995) = k · n(n−1)/2。V(1995)/V(1985)的比率是多少？然後計算用戶增長比率n(1995)/n(1985)。價值增長與用戶增長的比率告訴你什麼，關於為什麼電子郵件在1990年代初期突然變得不可或缺？

作為幾何的最佳化

Hamming的Boeing膠帶故事用精確的幾何意義描述了一個最佳化失敗。函數f(x)在景觀上的最佳化需要：

1. 一個定義良好的函數f：目標（拖力、成本、上市時間）

2. 一個固定的景觀：每次評估f的相同狀態

3. 一個梯度：最陡峭改進的方向

當測量之間景觀改變時，你估計的梯度可能指向在你採取下一步時不再存在的方向。你計算著gradient(f₁)但在景觀f₂中行動。

梯度下降

標準梯度下降：x_{t+1} = x_t − α ∇f(x_t)

其中α = 步長（學習率），∇f = 梯度向量（偏導數）。

Boeing失敗：在時間t，團隊測量f(x_t)。在時間t+1，團隊將x改為x_t + Δx。但共享數據庫也改變了：f現在是f' ≠ f。觀察到的變化：f'(x_t + Δx) − f(x_t)。這不是f的梯度 — 它包括一個來自景觀轉移的項。

幻影梯度

測量變化 = [f'(x+Δx) − f(x)] = [f(x+Δx) − f(x)] + [f'(x+Δx) − f(x+Δx)]

= 真實梯度 × Δx + 景觀轉移

如果景觀轉移占主導：團隊朝著f'中的最小值移動，該最小值在f中是最大值。他們最佳化了錯誤的東西 — 可能在測量顯示改進時使他們的設計變得更糟。

量化幻影梯度誤差

一個團隊最佳化拖力f(θ, s)，其中θ = 機翼角，s = 翼展。真實梯度：∂f/∂θ = −0.5（拖力隨θ減少），∂f/∂s = +0.3（拖力隨s增加）。

另一個團隊同時減少機身重量，改變拖力函數：f' = f − 0.8。（更輕的機身在所有配置下拖力減少0.8單位。）

第一個團隊測量：f'(θ+Δθ, s) − f(θ, s) = [f(θ+Δθ, s) − 0.8] − f(θ, s) = −0.5·Δθ − 0.8。

如果第一個團隊設置Δθ = 1（改變機翼角1個單位），測量變化是多少？他們將其歸因於什麼？他們自己的機翼角變化與機身重量變化產生的幻影貢獻的實際貢獻是多少？顯示算術並解釋：幻影梯度是否可能導致團隊過早停止最佳化θ？