Distancia en Espacio Binario
La contribución técnica más famosa de Richard Hamming: códigos correctores de errores. La idea geométrica detrás de ellos corre más profundo que cualquier código específico.
Distancia de Hamming
Dadas dos cadenas binarias de igual longitud, la distancia de Hamming d(u, v) cuenta posiciones donde difieren:
``
u = 1 0 1 1 0
v = 1 1 1 0 0
↑ ↑
d(u,v) = 2
``
Esto satisface los tres axiomas de métrica: d(u,v) ≥ 0; d(u,v) = 0 sii u = v; d(u,v) = d(v,u); d(u,w) ≤ d(u,v) + d(v,w). El espacio binario n-dimensional con distancia de Hamming forma un espacio métrico válido.
La geometría se visualiza claramente en dimensiones bajas. Todas las cadenas de 3 bits viven en los 8 vértices de un cubo. Los vértices adyacentes en arista difieren en exactamente 1 bit; los vértices en diagonal de cara difieren en 2; los vértices antipodales (p.ej. 000 y 111) difieren en 3.
Calculando la Distancia de Hamming
El peso de Hamming wt(v) cuenta el número de 1s en v. La distancia se relaciona al peso vía XOR:
d(u, v) = wt(u XOR v)
Ejemplo: u = 10110, v = 11100. XOR = 01010. Peso = 2. Así que d(u,v) = 2.
Corrección de Errores mediante Empaquetamiento de Esferas
Un código binario C ⊆ {0,1}^n consiste en palabras de código elegidas. Cuando una palabra de código se transmite sobre un canal ruidoso, algunos bits pueden cambiar. El receptor obtiene una cadena corrupta y debe recuperar la original.
Define una esfera de Hamming de radio t centrada en la palabra de código c:
B(c, t) = { v ∈ {0,1}^n : d(c, v) ≤ t }
Para corregir hasta t errores, las esferas B(c, t) alrededor de cada par de palabras de código no deben solaparse. Si se solapan, una palabra recibida podría estar en dos esferas y el decodificador no puede determinar qué palabra de código se envió.
La distancia mínima d_min del código lo rige todo:
- Detectar hasta d_min − 1 errores - Corregir hasta ⌊(d_min − 1) / 2⌋ errores
Código Hamming (7,4): n = 7 bits, k = 4 bits de datos, d_min = 3. Corrige 1 error. Detecta 2.
¿Cuántas Palabras de Código Caben?
¿Cuántas palabras de código puede contener un código de longitud n mientras aún corrige t errores? Cada palabra de código 'posee' una esfera de radio t. Todas las esferas juntas deben caber dentro de {0,1}^n, que tiene 2^n puntos.
Volumen de una esfera de Hamming de radio t en {0,1}^n:
Vol(n,t) = Σ_{i=0}^{t} C(n, i)
La cota de Hamming (cota de empaquetamiento de esferas) sigue directamente: un código que corrige t errores satisface
M · Vol(n,t) ≤ 2^n
donde M = número de palabras de código. Así que M ≤ 2^n / Vol(n,t).
Para el código Hamming (7,4): n=7, t=1. Vol(7,1) = C(7,0) + C(7,1) = 1 + 7 = 8. Cota: M ≤ 128 / 8 = 16. El código (7,4) logra M = 2^4 = 16: un código perfecto, lo que significa que las esferas recubren {0,1}^7 sin huecos.
√n vs n
Hamming usó un argumento de caminata aleatoria para hacer precisa la importancia de la visión a largo plazo. El argumento convierte una afirmación vaga — 'la visión ayuda' — en un hecho geométrico sobre distancias.
Caminata Aleatoria Simétrica en ℤ
En cada paso, muévete +1 o −1 con igual probabilidad. Después de n pasos, desplazamiento esperado desde el origen: E[|X_n|] ≈ √n.
Esto sigue de la varianza: Var(X_n) = n (pasos independientes, cada ±1 varianza 1). Desviación estándar = √n.
Caminata Dirigida
En cada paso, muévete +1 con probabilidad p > 1/2 (sesgo hacia una meta). Después de n pasos, posición esperada: E[X_n] = n(2p−1). Para p = 1 (completamente dirigida): E[X_n] = n.
El contraste: desviación aleatoria escala como √n; progreso dirigido escala como n.
Traducción de Hamming
En una carrera investigativa, cada día de trabajo representa un paso. Sin una visión clara de qué importa, el trabajo desviarse en muchas direcciones: después de n días, progreso neto ≈ √n. Con una visión coherente a largo plazo, el esfuerzo se alinea: después de n días, progreso neto ≈ n. La razón n / √n = √n crece sin límite.
La Razón √n
La caminata dirigida no requiere puntería perfecta. Cualquier sesgo persistente hacia una meta convierte desviación √n en algo más cercano a progreso n.
Límites del Modelo
Un modelo que predice 100x de producción de visión merece escrutinio. Varias cosas que omite:
1. Dimensionalidad: las carreras operan en espacio de alta dimensión, no en ℤ. La geometría de una caminata aleatoria en ℝ^d cambia significativamente con d.
2. Correlación: los pasos investigativos se correlacionan — el trabajo de hoy se construye sobre el de ayer. Las caminatas correlacionadas se comportan diferente de los pasos i.i.d.
3. La visión misma puede ser errónea: una caminata dirigida hacia el atractor incorrecto es peor que la desviación.
Tiempo de Duplicación
Hamming abrió su curso con la afirmación de que el conocimiento técnico se duplica aproximadamente cada 17 años. Esa afirmación tiene una estructura matemática precisa: crecimiento exponencial.
Modelo de Crecimiento Exponencial
y(t) = a · e^(b·t)
donde a = cantidad inicial en t = 0, b = tasa de crecimiento (por unidad de tiempo), e ≈ 2.718.
Tiempo de duplicación D: el tiempo para que y se duplique.
2a = a · e^(b·D) → 2 = e^(b·D) → ln(2) = b·D → D = ln(2) / b
ln(2) ≈ 0.693. Para b = 0.693/17 ≈ 0.0408 por año, tiempo de duplicación = 17 años.
Vida Media
Vida media H: tiempo para que y decaiga a la mitad de su valor (b < 0).
H = ln(2) / |b|
La misma fórmula en ambas direcciones. Una habilidad con vida media 5 años: después de 5 años, la mitad de su valor de mercado desaparece. Después de 10 años: un cuarto permanece. Después de 20 años: menos del 7% permanece.
Duplicación del Conocimiento
Si el conocimiento técnico se duplica cada 17 años, un estudiante que se gradúa a los 22 años enfrenta un panorama de conocimiento transformado a los 56 — una carrera de 34 años abarca dos duplicaciones completas.
Vida Media de la Experiencia
El mismo modelo exponencial se aplica al decaimiento. Una habilidad específica (p.ej. dominio de una arquitectura de chip particular, una API obsoleta, un algoritmo superado) pierde valor con el tiempo mientras el campo avanza.
Si la vida media de una habilidad especializada H = 5 años, entonces después de t años la fracción de valor original que permanece: f(t) = (1/2)^(t/H) = 2^(−t/H).
Después de una vida media (5 años): 50% permanece. Dos vidas medias (10 años): 25%. Tres (15 años): 12.5%. Cuatro (20 años): 6.25%.
La implicación de Hamming: el valor de aprender cómo aprender se compone positivamente con el mismo exponente que el conocimiento especializado decae. Invertir en estrategia de aprendizaje, encuadre de problemas, & razonamiento transferible preserva valor a través de ciclos de vida media.
Geometría, Corrección de Errores, & Carrera
Las tres estructuras geométricas de esta lección parecen desconectadas. Se conectan.
La distancia de Hamming formaliza el costo del error y la redundancia necesaria para recuperarse de él. Cada sistema de comunicación, cada base de código, cada cuerpo de conocimiento necesita suficiente redundancia que errores únicos no corrompan el todo.
El argumento √n vs n traduce visión en un hecho geométrico: la desviación escala como distancia desde un punto de partida, el movimiento dirigido escala como desplazamiento hacia una meta. La redundancia en estrategia de carrera — mantener múltiples líneas de investigación abiertas — amortigua contra el giro ocasional incorrecto.
El crecimiento & decaimiento exponencial rigen tanto la frontera expansiva como la vida media de lo que sabes hoy. La única inversión estable: aprender cómo aprender, que se compone en la misma escala de tiempo que el conocimiento especializado decae.