Afstand in Binaire Ruimte
Richard Hammings beroemdste technische bijdrage: foutcorrigerende codes. De geometrische idee erachter gaat dieper dan enige specifieke code.
Hammingafstand
Gegeven twee binaire strings van gelijke lengte, de Hammingafstand d(u, v) telt posities waar ze verschillen:
``
u = 1 0 1 1 0
v = 1 1 1 0 0
↑ ↑
d(u,v) = 2
``
Dit voldoet aan alle drie metrieken-axioma's: d(u,v) ≥ 0; d(u,v) = 0 als en alleen als u = v; d(u,v) = d(v,u); d(u,w) ≤ d(u,v) + d(v,w). Binaire n-ruimte met Hammingafstand vormt een geldige metrische ruimte.
De meetkunde visualiseert duidelijk in lage dimensies. Alle 3-bits strings bevinden zich op de 8 hoeken van een kubus. Randaangrenzende hoeken verschillen in exact 1 bit; diagonale vlakken verschillen in 2; tegenovergestelde hoeken (bijv. 000 en 111) verschillen in 3.
Hammingafstand Berekenen
Hamminggewicht wt(v) telt het aantal 1'en in v. Afstand relateert aan gewicht via XOR:
d(u, v) = wt(u XOR v)
Voorbeeld: u = 10110, v = 11100. XOR = 01010. Gewicht = 2. Dus d(u,v) = 2.
Foutcorrectie via Bolpakking
Een binaire code C ⊆ {0,1}^n bestaat uit gekozen codewoorden. Wanneer een codewoord via een rumoerig kanaal wordt verzonden, kunnen enkele bits omslaan. De ontvanger krijgt een beschadigde string en moet het origineel terugwinnen.
Definieer een Hammingbal met straal t gecentreerd op codewoord c:
B(c, t) = { v ∈ {0,1}^n : d(c, v) ≤ t }
Om tot t fouten te corrigeren, mogen de ballen B(c, t) rond elk paar codewoorden niet overlappen. Als ze overlappen, kan een ontvangen woord in twee ballen liggen en kan de decoder niet bepalen welk codewoord werd verzonden.
De minimale afstand d_min van een code bepaalt alles:
- Tot d_min − 1 fouten detecteren - Tot ⌊(d_min − 1) / 2⌋ fouten corrigeren
Hamming (7,4) code: n = 7 bits, k = 4 data bits, d_min = 3. Corrigeert 1 fout. Detecteert 2.
Hoeveel Codewoorden Passen?
Hoeveel codewoorden kan een lengte-n code bevatten en tegelijk t fouten corrigeren? Elk codewoord 'bezit' een bal met straal t. Al deze ballen moeten samen in {0,1}^n passen, dat n 2^n punten bevat.
Volume van een Hammingbal met straal t in {0,1}^n:
Vol(n,t) = Σ_{i=0}^{t} C(n, i)
De Hamminggrens (sphere-packing grens) volgt direct: een code die t fouten corrigeert, voldoet aan
M · Vol(n,t) ≤ 2^n
waarbij M = aantal codewoorden. Dus M ≤ 2^n / Vol(n,t).
Voor de Hamming (7,4) code: n=7, t=1. Vol(7,1) = C(7,0) + C(7,1) = 1 + 7 = 8. Grens: M ≤ 128 / 8 = 16. De (7,4) code bereikt M = 2^4 = 16: een perfecte code, wat betekent dat de ballen {0,1}^7 zonder gaten betegelen.
√n versus n
Hamming gebruikte een random-walk argument om de waarde van langetermijnvisie precies te maken. Het argument zet een vage bewering — 'visie helpt' — om in een geometrisch feit over afstanden.
Symmetrische Random Walk op ℤ
Bij elke stap, beweeg +1 of −1 met gelijke waarschijnlijkheid. Na n stappen, verwachte verplaatsing van oorsprong: E[|X_n|] ≈ √n.
Dit volgt uit de variantie: Var(X_n) = n (stappen onafhankelijk, elk ±1 variantie 1). Standaarddeviatie = √n.
Gericht Wandelen
Bij elke stap, beweeg +1 met waarschijnlijkheid p > 1/2 (voorkeuring voor een doel). Na n stappen, verwachte positie: E[X_n] = n(2p−1). Voor p = 1 (volledig gericht): E[X_n] = n.
Het contrast: willekeurige drift schaalt als √n; gericht voortgang schaalt als n.
Hammings Vertaling
In een onderzoekscarrière vertegenwoordigt elke werkdag één stap. Zonder duidelijke visie op wat belangrijk is, drijft werk in veel richtingen: na n dagen, netto voortgang ≈ √n. Met een samenhangend langetermijnvisie, is moeite gericht: na n dagen, netto voortgang ≈ n. De verhouding n / √n = √n groeit zonder grens.
De √n Verhouding
Het gerichte wandelen vereist geen perfecte nauwkeurigheid. Elke blijvende voorkeur voor een doel zet √n drift om in iets dichter bij n voortgang.
Grenzen van het Model
Een model dat 100x output uit visie voorspelt, verdient onderzoek. Verschillende dingen die het weggelaten:
1. Dimensionaliteit: carrières werken in hogedimensionale ruimte, niet ℤ. De meetkunde van een random walk in ℝ^d verandert significant met d.
2. Correlatie: onderzoeksstappen correleren — gisteren's werk bouwt op vandaag voort. Gecorreleerde walks gedragen zich anders dan i.i.d.-stappen.
3. De visie zelf kan fout zijn: een gericht wandelen naar de verkeerde attractor is erger dan drift.
Verdubbeltijd
Hamming opende zijn cursus met de bewering dat technische kennis ongeveer elke 17 jaar verdubbelt. Die bewering heeft een precieze wiskundige structuur: exponentiële groei.
Exponentiële Groeimodel
y(t) = a · e^(b·t)
waarbij a = initiële hoeveelheid op t = 0, b = groeicijfer (per eenheid tijd), e ≈ 2,718.
Verdubbeltijd D: de tijd voor y om te verdubbelen.
2a = a · e^(b·D) → 2 = e^(b·D) → ln(2) = b·D → D = ln(2) / b
ln(2) ≈ 0,693. Voor b = 0,693/17 ≈ 0,0408 per jaar, verdubbeltijd = 17 jaar.
Halfwaardetijd
Halfwaardetijd H: tijd voor y om naar de helft van zijn waarde af te nemen (b < 0).
H = ln(2) / |b|
Dezelfde formule in beide richtingen. Een vaardigheid met halfwaardetijd 5 jaar: na 5 jaar, helft van zijn marktwaarde weg. Na 10 jaar: een kwart blijft over. Na 20 jaar: minder dan 7% blijft over.
Kennisverdubbeling
Als technische kennis elke 17 jaar verdubbelt, staat een student die op 22-jarige leeftijd afstudeeert voor een omgetoverd kennislandschap op 56-jarige leeftijd — een 34-jarige carrière omspant twee volledige verdubbelingen.
Halfwaardetijd van Expertise
Hetzelfde exponentiële model geldt voor verval. Een specifieke vaardigheid (bijv. meesterschap van een bepaalde chiparchitectuur, een verouderde API, een verouderd algoritme) verliest waarde in de loop van de tijd terwijl het veld vooruitgaat.
Als de halfwaardetijd van een gespecialiseerde vaardigheid H = 5 jaar, dan na t jaren de fractie van originele waarde die blijft: f(t) = (1/2)^(t/H) = 2^(−t/H).
Na één halfwaardetijd (5 jaar): 50% blijft over. Twee halfwaardetijden (10 jaar): 25%. Drie (15 jaar): 12,5%. Vier (20 jaar): 6,25%.
Hammings implicatie: de waarde van het leren hoe te leren compound positief met dezelfde exponent waarmee gespecialiseerde kennis vervalt. Investeren in leerstrategieën, probleemformulering, & overdraagbare redenering behoudt waarde over halfwaardetijdcycli.
Meetkunde, Foutcorrectie, & Carrière
De drie geometrische structuren uit deze les lijken niet verbonden. Ze verbinden.
Hammingafstand formaliseert de kosten van fout en de redundantie die nodig is om ervan te herstellen. Elk communicatiesysteem, elke codebasis, elke kennisbasis heeft genoeg redundantie nodig zodat enkele fouten niet de gehele informatie corrumperen.
Het √n versus n argument vertaalt visie in een geometrisch feit: drift schaalt als afstand van een startpunt, gericht bewegen schaalt als verplaatsing naar een doel. Redundantie in carrièrestrategie — meerdere onderzoekslijnen open houden — buffers tegen af en toe een verkeerde wending.
Exponentiële groei & verval bepalen zowel de uitbreidende grens als de halfwaardetijd van wat je vandaag weet. De enige stabiele investering: leren hoe te leren, wat compound op dezelfde tijdschaal waarop gespecialiseerde kennis vervalt.