un — Meetkunde van Hamming

un

gast

1 / ?

terug naar lessen

Afstand in Binaire Ruimte

Richard Hammings beroemdste technische bijdrage: foutcorrigerende codes. De geometrische idee erachter gaat dieper dan enige specifieke code.

Hammingafstand

Gegeven twee binaire strings van gelijke lengte, de Hammingafstand d(u, v) telt posities waar ze verschillen:

``u = 1 0 1 1 0 v = 1 1 1 0 0 ↑ ↑ d(u,v) = 2``

Dit voldoet aan alle drie metrieken-axioma's: d(u,v) ≥ 0; d(u,v) = 0 als en alleen als u = v; d(u,v) = d(v,u); d(u,w) ≤ d(u,v) + d(v,w). Binaire n-ruimte met Hammingafstand vormt een geldige metrische ruimte.

De meetkunde visualiseert duidelijk in lage dimensies. Alle 3-bits strings bevinden zich op de 8 hoeken van een kubus. Randaangrenzende hoeken verschillen in exact 1 bit; diagonale vlakken verschillen in 2; tegenovergestelde hoeken (bijv. 000 en 111) verschillen in 3.

3-bits hyperkubus: Hammingafstand

Hammingafstand Berekenen

Hamminggewicht wt(v) telt het aantal 1'en in v. Afstand relateert aan gewicht via XOR:

d(u, v) = wt(u XOR v)

Voorbeeld: u = 10110, v = 11100. XOR = 01010. Gewicht = 2. Dus d(u,v) = 2.

Bereken d(u, v) voor u = 10011101 en v = 11010100. Toon de XOR-stap, tel daarna de verschillende bits.

Foutcorrectie via Bolpakking

Een binaire code C ⊆ {0,1}^n bestaat uit gekozen codewoorden. Wanneer een codewoord via een rumoerig kanaal wordt verzonden, kunnen enkele bits omslaan. De ontvanger krijgt een beschadigde string en moet het origineel terugwinnen.

Definieer een Hammingbal met straal t gecentreerd op codewoord c:

B(c, t) = { v ∈ {0,1}^n : d(c, v) ≤ t }

Om tot t fouten te corrigeren, mogen de ballen B(c, t) rond elk paar codewoorden niet overlappen. Als ze overlappen, kan een ontvangen woord in twee ballen liggen en kan de decoder niet bepalen welk codewoord werd verzonden.

De minimale afstand d_min van een code bepaalt alles:

- Tot d_min − 1 fouten detecteren - Tot ⌊(d_min − 1) / 2⌋ fouten corrigeren

Hamming (7,4) code: n = 7 bits, k = 4 data bits, d_min = 3. Corrigeert 1 fout. Detecteert 2.

Foutcorrectie: Bolpakking

Een code heeft minimale afstand 5. Hoeveel fouten kan het detecteren? Hoeveel kan het corrigeren? Toon de formules, bereken daarna beide waarden.

Hoeveel Codewoorden Passen?

Hoeveel codewoorden kan een lengte-n code bevatten en tegelijk t fouten corrigeren? Elk codewoord 'bezit' een bal met straal t. Al deze ballen moeten samen in {0,1}^n passen, dat n 2^n punten bevat.

Volume van een Hammingbal met straal t in {0,1}^n:

Vol(n,t) = Σ_{i=0}^{t} C(n, i)

De Hamminggrens (sphere-packing grens) volgt direct: een code die t fouten corrigeert, voldoet aan

M · Vol(n,t) ≤ 2^n

waarbij M = aantal codewoorden. Dus M ≤ 2^n / Vol(n,t).

Voor de Hamming (7,4) code: n=7, t=1. Vol(7,1) = C(7,0) + C(7,1) = 1 + 7 = 8. Grens: M ≤ 128 / 8 = 16. De (7,4) code bereikt M = 2^4 = 16: een perfecte code, wat betekent dat de ballen {0,1}^7 zonder gaten betegelen.

Voor n = 15 en t = 1 (enkelvoudige foutcorrectie), bereken Vol(15, 1) en de Hamminggrens op het aantal codewoorden M. Is M = 2^11 haalbaar gegeven de grens?

√n versus n

Hamming gebruikte een random-walk argument om de waarde van langetermijnvisie precies te maken. Het argument zet een vage bewering — 'visie helpt' — om in een geometrisch feit over afstanden.

Symmetrische Random Walk op ℤ

Bij elke stap, beweeg +1 of −1 met gelijke waarschijnlijkheid. Na n stappen, verwachte verplaatsing van oorsprong: E[|X_n|] ≈ √n.

Dit volgt uit de variantie: Var(X_n) = n (stappen onafhankelijk, elk ±1 variantie 1). Standaarddeviatie = √n.

Gericht Wandelen

Bij elke stap, beweeg +1 met waarschijnlijkheid p > 1/2 (voorkeuring voor een doel). Na n stappen, verwachte positie: E[X_n] = n(2p−1). Voor p = 1 (volledig gericht): E[X_n] = n.

Het contrast: willekeurige drift schaalt als √n; gericht voortgang schaalt als n.

Random Walk versus Gericht Wandelen

Hammings Vertaling

In een onderzoekscarrière vertegenwoordigt elke werkdag één stap. Zonder duidelijke visie op wat belangrijk is, drijft werk in veel richtingen: na n dagen, netto voortgang ≈ √n. Met een samenhangend langetermijnvisie, is moeite gericht: na n dagen, netto voortgang ≈ n. De verhouding n / √n = √n groeit zonder grens.

De √n Verhouding

Het gerichte wandelen vereist geen perfecte nauwkeurigheid. Elke blijvende voorkeur voor een doel zet √n drift om in iets dichter bij n voortgang.

Hamming zei dat iemand met duidelijke visie ongeveer √n keer zoveel bereikt over een carrière als iemand zonder visie, waarbij n het aantal werkdagen is. Als een carrière 10.000 werkdagen beslaat, welke verhouding voorspelt dit? Wat zegt het getal over de praktische waarde van blijvende visie?

Grenzen van het Model

Een model dat 100x output uit visie voorspelt, verdient onderzoek. Verschillende dingen die het weggelaten:

1. Dimensionaliteit: carrières werken in hogedimensionale ruimte, niet ℤ. De meetkunde van een random walk in ℝ^d verandert significant met d.

2. Correlatie: onderzoeksstappen correleren — gisteren's werk bouwt op vandaag voort. Gecorreleerde walks gedragen zich anders dan i.i.d.-stappen.

3. De visie zelf kan fout zijn: een gericht wandelen naar de verkeerde attractor is erger dan drift.

Bepaal één aanname waarvan het √n versus n argument afhangt, die je in echte onderzoekscarrières het meest verdacht vindt. Leg uit waarom die aanname belangrijk is voor de 100x-voorspelling.

Verdubbeltijd

Hamming opende zijn cursus met de bewering dat technische kennis ongeveer elke 17 jaar verdubbelt. Die bewering heeft een precieze wiskundige structuur: exponentiële groei.

Exponentiële Groeimodel

y(t) = a · e^(b·t)

waarbij a = initiële hoeveelheid op t = 0, b = groeicijfer (per eenheid tijd), e ≈ 2,718.

Verdubbeltijd D: de tijd voor y om te verdubbelen.

2a = a · e^(b·D) → 2 = e^(b·D) → ln(2) = b·D → D = ln(2) / b

ln(2) ≈ 0,693. Voor b = 0,693/17 ≈ 0,0408 per jaar, verdubbeltijd = 17 jaar.

Halfwaardetijd

Halfwaardetijd H: tijd voor y om naar de helft van zijn waarde af te nemen (b < 0).

H = ln(2) / |b|

Dezelfde formule in beide richtingen. Een vaardigheid met halfwaardetijd 5 jaar: na 5 jaar, helft van zijn marktwaarde weg. Na 10 jaar: een kwart blijft over. Na 20 jaar: minder dan 7% blijft over.

Kennisverdubbeling

Als technische kennis elke 17 jaar verdubbelt, staat een student die op 22-jarige leeftijd afstudeeert voor een omgetoverd kennislandschap op 56-jarige leeftijd — een 34-jarige carrière omspant twee volledige verdubbelingen.

Gebruik D = ln(2) / b, bereken het jaarlijkse groeicijfer b dat door een 17-jarige verdubbeltijd wordt geïmpliceerd. Gebruik daarna y(t) = e^(b·t) om de factor te vinden waarmee de kennisbasis zich over een 34-jarige carrière vermenigvuldigt. Toon je werk.

Halfwaardetijd van Expertise

Hetzelfde exponentiële model geldt voor verval. Een specifieke vaardigheid (bijv. meesterschap van een bepaalde chiparchitectuur, een verouderde API, een verouderd algoritme) verliest waarde in de loop van de tijd terwijl het veld vooruitgaat.

Als de halfwaardetijd van een gespecialiseerde vaardigheid H = 5 jaar, dan na t jaren de fractie van originele waarde die blijft: f(t) = (1/2)^(t/H) = 2^(−t/H).

Na één halfwaardetijd (5 jaar): 50% blijft over. Twee halfwaardetijden (10 jaar): 25%. Drie (15 jaar): 12,5%. Vier (20 jaar): 6,25%.

Hammings implicatie: de waarde van het leren hoe te leren compound positief met dezelfde exponent waarmee gespecialiseerde kennis vervalt. Investeren in leerstrategieën, probleemformulering, & overdraagbare redenering behoudt waarde over halfwaardetijdcycli.

Een software-engineer's expertise in een specifiek framework heeft een halfwaardetijd van 4 jaar. Ze heeft 12 jaar tot pensioen. Welke fractie van die expertise's waarde blijft bij pensioen over? Interpreteer daarna: wat zegt dit over hoe ze leertijd tussen diepe specialisatie en overdraagbare vaardigheden moet alloceren?

Meetkunde, Foutcorrectie, & Carrière

De drie geometrische structuren uit deze les lijken niet verbonden. Ze verbinden.

Hammingafstand formaliseert de kosten van fout en de redundantie die nodig is om ervan te herstellen. Elk communicatiesysteem, elke codebasis, elke kennisbasis heeft genoeg redundantie nodig zodat enkele fouten niet de gehele informatie corrumperen.

Het √n versus n argument vertaalt visie in een geometrisch feit: drift schaalt als afstand van een startpunt, gericht bewegen schaalt als verplaatsing naar een doel. Redundantie in carrièrestrategie — meerdere onderzoekslijnen open houden — buffers tegen af en toe een verkeerde wending.

Exponentiële groei & verval bepalen zowel de uitbreidende grens als de halfwaardetijd van wat je vandaag weet. De enige stabiele investering: leren hoe te leren, wat compound op dezelfde tijdschaal waarop gespecialiseerde kennis vervalt.

Verbind minstens twee van deze drie geometrische ideeën aan één concrete beslissing waarmee je in je vakgebied of carrière wordt geconfronteerd. De verbinding moet specifiek zijn: noem de beslissing, noem de geometrische structuur, & leg uit wat de meetkunde je vertelt anders te doen dan zonder die inzichten.