English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

게스트
1 / ?
수업 목록으로

팩토리얼의 로그 스케일

스털링 근사는 곱을 합으로 변환하며, 이것이 큰 n에 대한 수학을 다루기 쉽게 만드는 기본 동작입니다:

ln(n!) ≈ n·ln(n) − n + 0.5·ln(2πn)

이 공식은 k=1..n에 대한 합 Σ ln(k)를 ln(x)의 적분으로 근사한 후 사다리꼴 규칙을 적용하여 오차를 한정한 결과입니다.

기하학적으로 왜 중요한가

n차원 구의 부피 공식은 Γ(n/2 + 1)을 포함하며, 정수 n에 대해 (n/2)! 또는 반정수의 곱과 같습니다. 스털링 근사는 각 값을 직접 계산하지 않고도 큰 n에 대해 이를 추정할 수 있게 합니다.

스털링 근사는 10진법 표기법에서 log(n!) ≈ n·log(n) − n·log(e)를 제공하며, 자리수 추정에 유용합니다.

n = 10일 때: ln(10!) ≈ 10·2.303 − 10 + 0.5·ln(62.83) ≈ 23.03 − 10 + 2.08 = 15.10 (참값: 15.104).

n = 100일 때: ln(100!) ≈ 100·4.605 − 100 + 0.5·ln(628.3) ≈ 460.5 − 100 + 3.24 = 363.7 (참값: 363.74).

n=20에서 스털링 근사

직접 계산: ln(20) ≈ 2.996. ln(2π·20) = ln(125.66) ≈ 4.833.

스털링의 로그 공식을 사용하여 ln(20!)을 계산하세요. 그런 다음 e^(당신의 답)을 취하여 20!을 추정하세요. 참값 20! = 2,432,902,008,176,640,000 ≈ 2.433 × 10^18과 비교하세요. 세 항 모두를 보여주세요.

부피 공식

반지름 r인 n차원 구의 부피:

V_n(r) = C_n · r^n 여기서 C_n = π^(n/2) / Γ(n/2 + 1)

작은 n에 대한 C_n 값들은 Γ(1/2) = √π 및 감소 공식을 사용하는 패턴을 따릅니다:

- n=1: C_1 = π^(1/2)/Γ(3/2) = √π/(√π/2) = 2

- n=2: C_2 = π^1/Γ(2) = π/1 = π

- n=3: C_3 = π^(3/2)/Γ(5/2) = π^(3/2)/(3√π/4) = 4π/3

- n=4: C_4 = π²/Γ(3) = π²/2

- n=5: C_5 = π^(5/2)/Γ(7/2) = π^(5/2)/(15√π/8) = 8π²/15

알아차릴 점: C_n은 n≈5 근처에서 최대값을 가집니다(≈ 5.264), 그 후 감소합니다. 큰 n에 대해 C_n → 0.

단위 구의 부피 vs 차원

n=5에서의 최대값

C_5 = 8π²/15. π² ≈ 9.870으로:

C_5 = 8·9.870/15 = 78.96/15 ≈ 5.264

이것이 최대값임을 확인하려면: C_6 = π³/6 ≈ 31.006/6 ≈ 5.168. 따라서 C_6 < C_5 — 최대값은 n=5에서 나타났습니다.

C_4 = π²/2 ≈ 4.935임을 확인하세요. 그런 다음 C_5/C_4 및 C_6/C_5를 계산하세요. 이 비율들이 n=4와 n=6 사이의 최대값을 확인하나요? 작업을 보여주세요.

코너에 있는 부피의 비율

정량화된 코너 역설: n차원 단위 초입방체 [−1,1]^n의 얼마나 많은 부분이 반지름 1인 내접 구의 바깥쪽에 있나요?

코너 비율 = 1 − C_n / 2^n

코너 역설

| n | C_n | 2^n | 구의 비율 | 코너 비율 | |---|---|---|---|---| | 2 | 3.14 | 4 | 78.5% | 21.5% | | 3 | 4.19 | 8 | 52.4% | 47.6% | | 4 | 4.93 | 16 | 30.8% | 69.2% | | 5 | 5.26 | 32 | 16.4% | 83.6% | | 6 | 5.17 | 64 | 8.1% | 91.9% | | 10 | 2.55 | 1024 | 0.25% | 99.75% |

n=8에 대해, C_8 = π⁴/24 ≈ 4.059. 코너 비율을 계산하세요. 그런 다음 해석하세요: 8차원 단위 초입방체에서 1000개의 균일한 임의 표본을 그리면, 내접 구 내부에 떨어질 것으로 예상되는 표본은 몇 개인가요?

최적화에 대한 함의

코너 역설은 고차원 공간에서의 최적화에 직접적인 영향을 미칩니다:

임의 탐색 실패. n차원 매개변수 공간의 임의 점은 거의 항상 코너에 떨어집니다 — 원점으로부터 멀리, 극단적인 매개변수 값으로. 좋은 해결책이 적당한 매개변수 값 근처에 집중되어 있다면, 임의 탐색은 거의 찾지 못할 것입니다.

경사 하강법 성공. 지역 경사를 따라가면, 임의로 표본을 추출하는 대신 체계적으로 기하학을 탐색합니다. 차원의 저주는 임의 방법을 타격합니다; 구조화된 방법은 적응합니다.

거리 집중화. 고차원에서, 임의 점 사이의 모든 쌍별 거리는 동일한 값 주위에 집중됩니다: [0,1]^n의 균일 점에 대해 모두 대략 √(2n/3)가 됩니다. 가장 가까운 이웃 방법은 '가장 가까운'과 '가장 먼'이 구별 불가능해 지기 때문에 무너집니다.

해밍의 처방: 당신의 직관을 신뢰하기 전에 기하학을 이해하세요. 고차원 공간에서, 기하학은 직관에 반합니다, 그리고 수학이 유일한 신뢰할 수 있는 안내입니다.

신경망은 10,000개의 가중치 매개변수를 가집니다. 각 가중치는 [−1, 1]에서 균일하게 초기화됩니다. 코너 역설은 이러한 초기화 점들이 본질적으로 단위 10,000차원 구 내부에 있지 않다고 말합니다. 그러나 신경망은 임의 초기화에서 성공적으로 훈련됩니다. 이것은 손실 풍경의 기하학에 대해 무엇을 말하며, 어떤 것이 '좋은 초기화'와 '단위 구' 사이의 유추를 무너뜨리나요?