un — Geometria di Hamming

un

ospite

1 / ?

torna alle lezioni

Distanza nello Spazio Binario

Il contributo tecnico più famoso di Richard Hamming: i codici di correzione degli errori. L'idea geometrica dietro di essi è più profonda di qualsiasi codice specifico.

Distanza di Hamming

Dati due stringhe binarie di lunghezza uguale, la distanza di Hamming d(u, v) conta le posizioni in cui differiscono:

``u = 1 0 1 1 0 v = 1 1 1 0 0 ↑ ↑ d(u,v) = 2``

Questo soddisfa i tre assiomi metrici: d(u,v) ≥ 0; d(u,v) = 0 iff u = v; d(u,v) = d(v,u); d(u,w) ≤ d(u,v) + d(v,w). Lo spazio n-dimensionale binario con distanza di Hamming forma uno spazio metrico valido.

La geometria si visualizza chiaramente in basse dimensioni. Tutti i valori di stringa a 3 bit vivono agli 8 vertici di un cubo. I vertici adiacenti ai margini differiscono in esattamente 1 bit; i vertici in diagonale sulla faccia differiscono in 2; i vertici antipodali (es. 000 e 111) differiscono in 3.

Ipercubo a 3 bit: Distanza di Hamming

Calcolo della Distanza di Hamming

Il peso di Hamming wt(v) conta il numero di 1 in v. La distanza si relaziona al peso tramite XOR:

d(u, v) = wt(u XOR v)

Esempio: u = 10110, v = 11100. XOR = 01010. Peso = 2. Quindi d(u,v) = 2.

Calcola d(u, v) per u = 10011101 e v = 11010100. Mostra il passaggio XOR, quindi conta i bit diversi.

Correzione degli Errori tramite Sphere Packing

Un codice binario C ⊆ {0,1}^n consiste di parole di codice scelte. Quando una parola di codice si trasmette su un canale rumoroso, alcuni bit possono capovolgersi. Il ricevitore riceve una stringa corrotta e deve ripristinare l'originale.

Definisci una sfera di Hamming di raggio t centrata sulla parola di codice c:

B(c, t) = { v ∈ {0,1}^n : d(c, v) ≤ t }

Per correggere fino a t errori, le sfere B(c, t) attorno a ogni coppia di parole di codice non devono sovrapporsi. Se si sovrappongono, una parola ricevuta potrebbe trovarsi in due sfere e il decodificatore non può determinare quale parola di codice è stata inviata.

La distanza minima d_min di un codice governa tutto:

- Rilevare fino a d_min − 1 errori - Correggere fino a ⌊(d_min − 1) / 2⌋ errori

Codice Hamming (7,4): n = 7 bit, k = 4 bit dati, d_min = 3. Corregge 1 errore. Rileva 2.

Correzione degli Errori: Sphere Packing

Un codice ha distanza minima 5. Quanti errori può rilevare? Quanti può correggere? Mostra le formule, quindi calcola entrambi i valori.

Quante Parole di Codice si Adattano?

Quante parole di codice può contenere un codice di lunghezza n mentre corregge ancora t errori? Ogni parola di codice 'possiede' una sfera di raggio t. Tutte le sfere insieme devono stare dentro {0,1}^n, che ha 2^n punti.

Volume di una sfera di Hamming di raggio t in {0,1}^n:

Vol(n,t) = Σ_{i=0}^{t} C(n, i)

Il limite di Hamming (sphere-packing bound) segue direttamente: un codice che corregge t errori soddisfa

M · Vol(n,t) ≤ 2^n

dove M = numero di parole di codice. Quindi M ≤ 2^n / Vol(n,t).

Per il codice Hamming (7,4): n=7, t=1. Vol(7,1) = C(7,0) + C(7,1) = 1 + 7 = 8. Limite: M ≤ 128 / 8 = 16. Il codice (7,4) raggiunge M = 2^4 = 16: un codice perfetto, il che significa che le sfere pavimentano {0,1}^7 senza spazi.

Per n = 15 e t = 1 (correzione di errore singolo), calcola Vol(15, 1) e il limite di Hamming sul numero di parole di codice M. È possibile M = 2^11 dato il limite?

√n vs n

Hamming ha utilizzato un argomento di random walk per rendere preciso il valore della visione a lungo raggio. L'argomento converte un'affermazione vaga — 'la visione aiuta' — in un fatto geometrico riguardante le distanze.

Random Walk Simmetrico su ℤ

Ad ogni passo, muoviti +1 o −1 con pari probabilità. Dopo n passi, lo spostamento atteso dall'origine: E[|X_n|] ≈ √n.

Questo segue dalla varianza: Var(X_n) = n (passi indipendenti, ogni ±1 varianza 1). Deviazione standard = √n.

Random Walk Diretto

Ad ogni passo, muoviti +1 con probabilità p > 1/2 (bias verso un obiettivo). Dopo n passi, la posizione attesa: E[X_n] = n(2p−1). Per p = 1 (completamente diretto): E[X_n] = n.

Il contrasto: la deriva casuale scala come √n; il progresso diretto scala come n.

Random Walk vs Random Walk Diretto

La Traduzione di Hamming

In una carriera di ricerca, ogni giorno lavorativo rappresenta un passo. Senza una visione chiara di ciò che importa, il lavoro si trascinava in molte direzioni: dopo n giorni, il progresso netto ≈ √n. Con una visione coerente a lungo raggio, lo sforzo si allinea: dopo n giorni, il progresso netto ≈ n. Il rapporto n / √n = √n cresce senza limiti.

Il Rapporto √n

Il random walk diretto non richiede una mira perfetta. Qualsiasi bias persistente verso un obiettivo converte la deriva √n in qualcosa di più vicino al progresso n.

Hamming ha detto che una persona con una visione chiara compie circa √n volte di più durante una carriera rispetto a una senza, dove n è il numero di giorni lavorativi. Se una carriera dura 10.000 giorni lavorativi, quale rapporto predice questo? Cosa suggerisce il numero sul valore pratico della visione sostenuta?

Limiti del Modello

Un modello che predice un output 100x dalla visione merita scrutinio. Varie cose che omette:

1. Dimensionalità: le carriere operano nello spazio multidimensionale, non ℤ. La geometria di un random walk in ℝ^d cambia significativamente con d.

2. Correlazione: i passi di ricerca si correlano — il lavoro di oggi si costruisce su quello di ieri. I random walk correlati si comportano diversamente dai passi i.i.d.

3. La visione stessa potrebbe essere sbagliata: un random walk diretto verso un attrattore sbagliato è peggio della deriva.

Identifica un'assunzione su cui si basa l'argomento √n vs n che consideri più sospetta nelle vere carriere di ricerca. Spiega perché quella assunzione importa per la previsione 100x.

Tempo di Raddoppio

Hamming ha aperto il suo corso con l'affermazione che la conoscenza tecnica si raddoppia grosso modo ogni 17 anni. Quella affermazione ha una struttura matematica precisa: crescita esponenziale.

Modello di Crescita Esponenziale

y(t) = a · e^(b·t)

dove a = quantità iniziale a t = 0, b = tasso di crescita (per unità di tempo), e ≈ 2.718.

Tempo di raddoppio D: il tempo per raddoppiare y.

2a = a · e^(b·D) → 2 = e^(b·D) → ln(2) = b·D → D = ln(2) / b

ln(2) ≈ 0.693. Per b = 0.693/17 ≈ 0.0408 per anno, il tempo di raddoppio = 17 anni.

Emivita

Emivita H: il tempo per decadere a metà del suo valore (b < 0).

H = ln(2) / |b|

La stessa formula in entrambe le direzioni. Una competenza con emivita di 5 anni: dopo 5 anni, metà del suo valore di mercato se ne è andato. Dopo 10 anni: un quarto rimane. Dopo 20 anni: meno del 7% rimane.

Raddoppio della Conoscenza

Se la conoscenza tecnica si raddoppia ogni 17 anni, uno studente che si laurea a 22 anni affronta un panorama della conoscenza trasformato a 56 anni — una carriera di 34 anni copre due raddoppi completi.

Utilizzando D = ln(2) / b, calcola il tasso di crescita annuale b implicito da un tempo di raddoppio di 17 anni. Poi usa y(t) = e^(b·t) per trovare il fattore per il quale la base di conoscenza si moltiplica su una carriera di 34 anni. Mostra il tuo lavoro.

Emivita dell'Expertise

Lo stesso modello esponenziale si applica al decadimento. Una competenza specifica (es. padronanza di una particolare architettura di chip, un'API deprecata, un algoritmo superato) perde valore nel tempo mentre il campo procede.

Se l'emivita di una competenza specializzata H = 5 anni, allora dopo t anni la frazione del valore originale rimanente: f(t) = (1/2)^(t/H) = 2^(−t/H).

Dopo un'emivita (5 anni): rimane il 50%. Due emivite (10 anni): 25%. Tre (15 anni): 12,5%. Quattro (20 anni): 6,25%.

L'implicazione di Hamming: il valore dell'apprendimento di come imparare compone positivamente con lo stesso esponente che la conoscenza specializzata decade. Investire in strategia di apprendimento, inquadramento dei problemi, & ragionamento trasferibile preserva il valore attraverso i cicli di emivita.

L'expertise di un ingegnere software in un framework specifico ha un'emivita di 4 anni. Ha 12 anni fino al pensionamento. Quale frazione del valore dell'expertise rimane al pensionamento? Poi interpreta: cosa suggerisce questo su come dovrebbe allocare il tempo di apprendimento tra specializzazione profonda e competenze trasferibili?

Geometria, Correzione degli Errori, & Carriera

Le tre strutture geometriche di questa lezione sembrano disconnesse. Si connettono.

La distanza di Hamming formalizza il costo dell'errore e la ridondanza necessaria per recuperare da esso. Ogni sistema di comunicazione, ogni codebase, ogni corpo di conoscenza ha bisogno di una ridondanza sufficiente affinché gli errori singoli non corrompano il tutto.

L'argomento √n vs n traduce la visione in un fatto geometrico: la deriva scala come la distanza da un punto di partenza, il movimento diretto scala come lo spostamento verso un obiettivo. La ridondanza nella strategia di carriera — mantenere aperte più linee di indagine — fornisce un buffer contro il raro movimento sbagliato.

La crescita e il decadimento esponenziale governano sia la frontiera in espansione che l'emivita di ciò che sai oggi. L'unico investimento stabile: imparare come imparare, che compone sulla stessa scala temporale che la conoscenza specializzata decade.

Collega almeno due di queste tre idee geometriche a una singola decisione concreta che affronti nel tuo campo o carriera. La connessione dovrebbe essere specifica: nomina la decisione, nomina la struttura geometrica, e spiega cosa la geometria ti dice di fare diversamente rispetto a quello che faresti senza di essa.