un — Geometría del código de Hamming

un

invitado

1 / ?

volver a las lecciones

Distancia en Espacio Binario

La contribución técnica más famosa de Richard Hamming: códigos correctores de errores. La idea geométrica detrás de ellos corre más profundo que cualquier código específico.

Distancia de Hamming

Dadas dos cadenas binarias de igual longitud, la distancia de Hamming d(u, v) cuenta posiciones donde difieren:

``u = 1 0 1 1 0 v = 1 1 1 0 0 ↑ ↑ d(u,v) = 2``

Esto satisface los tres axiomas de métrica: d(u,v) ≥ 0; d(u,v) = 0 sii u = v; d(u,v) = d(v,u); d(u,w) ≤ d(u,v) + d(v,w). El espacio binario n-dimensional con distancia de Hamming forma un espacio métrico válido.

La geometría se visualiza claramente en dimensiones bajas. Todas las cadenas de 3 bits viven en los 8 vértices de un cubo. Los vértices adyacentes en arista difieren en exactamente 1 bit; los vértices en diagonal de cara difieren en 2; los vértices antipodales (p.ej. 000 y 111) difieren en 3.

Hipercubo de 3 bits: Distancia de Hamming

Calculando la Distancia de Hamming

El peso de Hamming wt(v) cuenta el número de 1s en v. La distancia se relaciona al peso vía XOR:

d(u, v) = wt(u XOR v)

Ejemplo: u = 10110, v = 11100. XOR = 01010. Peso = 2. Así que d(u,v) = 2.

Calcula d(u, v) para u = 10011101 y v = 11010100. Muestra el paso XOR, luego cuenta los bits que difieren.

Corrección de Errores mediante Empaquetamiento de Esferas

Un código binario C ⊆ {0,1}^n consiste en palabras de código elegidas. Cuando una palabra de código se transmite sobre un canal ruidoso, algunos bits pueden cambiar. El receptor obtiene una cadena corrupta y debe recuperar la original.

Define una esfera de Hamming de radio t centrada en la palabra de código c:

B(c, t) = { v ∈ {0,1}^n : d(c, v) ≤ t }

Para corregir hasta t errores, las esferas B(c, t) alrededor de cada par de palabras de código no deben solaparse. Si se solapan, una palabra recibida podría estar en dos esferas y el decodificador no puede determinar qué palabra de código se envió.

La distancia mínima d_min del código lo rige todo:

- Detectar hasta d_min − 1 errores - Corregir hasta ⌊(d_min − 1) / 2⌋ errores

Código Hamming (7,4): n = 7 bits, k = 4 bits de datos, d_min = 3. Corrige 1 error. Detecta 2.

Corrección de Errores: Empaquetamiento de Esferas

Un código tiene distancia mínima 5. ¿Cuántos errores puede detectar? ¿Cuántos puede corregir? Muestra las fórmulas, luego calcula ambos valores.

¿Cuántas Palabras de Código Caben?

¿Cuántas palabras de código puede contener un código de longitud n mientras aún corrige t errores? Cada palabra de código 'posee' una esfera de radio t. Todas las esferas juntas deben caber dentro de {0,1}^n, que tiene 2^n puntos.

Volumen de una esfera de Hamming de radio t en {0,1}^n:

Vol(n,t) = Σ_{i=0}^{t} C(n, i)

La cota de Hamming (cota de empaquetamiento de esferas) sigue directamente: un código que corrige t errores satisface

M · Vol(n,t) ≤ 2^n

donde M = número de palabras de código. Así que M ≤ 2^n / Vol(n,t).

Para el código Hamming (7,4): n=7, t=1. Vol(7,1) = C(7,0) + C(7,1) = 1 + 7 = 8. Cota: M ≤ 128 / 8 = 16. El código (7,4) logra M = 2^4 = 16: un código perfecto, lo que significa que las esferas recubren {0,1}^7 sin huecos.

Para n = 15 y t = 1 (corrección de error único), calcula Vol(15, 1) y la cota de Hamming sobre el número de palabras de código M. ¿Es M = 2^11 alcanzable dada la cota?

√n vs n

Hamming usó un argumento de caminata aleatoria para hacer precisa la importancia de la visión a largo plazo. El argumento convierte una afirmación vaga — 'la visión ayuda' — en un hecho geométrico sobre distancias.

Caminata Aleatoria Simétrica en ℤ

En cada paso, muévete +1 o −1 con igual probabilidad. Después de n pasos, desplazamiento esperado desde el origen: E[|X_n|] ≈ √n.

Esto sigue de la varianza: Var(X_n) = n (pasos independientes, cada ±1 varianza 1). Desviación estándar = √n.

Caminata Dirigida

En cada paso, muévete +1 con probabilidad p > 1/2 (sesgo hacia una meta). Después de n pasos, posición esperada: E[X_n] = n(2p−1). Para p = 1 (completamente dirigida): E[X_n] = n.

El contraste: desviación aleatoria escala como √n; progreso dirigido escala como n.

Caminata Aleatoria vs Caminata Dirigida

Traducción de Hamming

En una carrera investigativa, cada día de trabajo representa un paso. Sin una visión clara de qué importa, el trabajo desviarse en muchas direcciones: después de n días, progreso neto ≈ √n. Con una visión coherente a largo plazo, el esfuerzo se alinea: después de n días, progreso neto ≈ n. La razón n / √n = √n crece sin límite.

La Razón √n

La caminata dirigida no requiere puntería perfecta. Cualquier sesgo persistente hacia una meta convierte desviación √n en algo más cercano a progreso n.

Hamming dijo que una persona con visión clara logra aproximadamente √n veces más durante una carrera que quien no la tiene, donde n es el número de días de trabajo. Si una carrera abarca 10,000 días de trabajo, ¿qué razón predice esto? ¿Qué sugiere el número sobre el valor práctico de la visión sostenida?

Límites del Modelo

Un modelo que predice 100x de producción de visión merece escrutinio. Varias cosas que omite:

1. Dimensionalidad: las carreras operan en espacio de alta dimensión, no en ℤ. La geometría de una caminata aleatoria en ℝ^d cambia significativamente con d.

2. Correlación: los pasos investigativos se correlacionan — el trabajo de hoy se construye sobre el de ayer. Las caminatas correlacionadas se comportan diferente de los pasos i.i.d.

3. La visión misma puede ser errónea: una caminata dirigida hacia el atractor incorrecto es peor que la desviación.

Identifica un supuesto del que depende el argumento √n vs n que consideres más sospechoso en carreras investigativas reales. Explica por qué ese supuesto importa para la predicción de 100x.

Tiempo de Duplicación

Hamming abrió su curso con la afirmación de que el conocimiento técnico se duplica aproximadamente cada 17 años. Esa afirmación tiene una estructura matemática precisa: crecimiento exponencial.

Modelo de Crecimiento Exponencial

y(t) = a · e^(b·t)

donde a = cantidad inicial en t = 0, b = tasa de crecimiento (por unidad de tiempo), e ≈ 2.718.

Tiempo de duplicación D: el tiempo para que y se duplique.

2a = a · e^(b·D) → 2 = e^(b·D) → ln(2) = b·D → D = ln(2) / b

ln(2) ≈ 0.693. Para b = 0.693/17 ≈ 0.0408 por año, tiempo de duplicación = 17 años.

Vida Media

Vida media H: tiempo para que y decaiga a la mitad de su valor (b < 0).

H = ln(2) / |b|

La misma fórmula en ambas direcciones. Una habilidad con vida media 5 años: después de 5 años, la mitad de su valor de mercado desaparece. Después de 10 años: un cuarto permanece. Después de 20 años: menos del 7% permanece.

Duplicación del Conocimiento

Si el conocimiento técnico se duplica cada 17 años, un estudiante que se gradúa a los 22 años enfrenta un panorama de conocimiento transformado a los 56 — una carrera de 34 años abarca dos duplicaciones completas.

Usando D = ln(2) / b, calcula la tasa de crecimiento anual b implícita por un tiempo de duplicación de 17 años. Luego usa y(t) = e^(b·t) para encontrar el factor por el que la base de conocimiento se multiplica en una carrera de 34 años. Muestra tu trabajo.

Vida Media de la Experiencia

El mismo modelo exponencial se aplica al decaimiento. Una habilidad específica (p.ej. dominio de una arquitectura de chip particular, una API obsoleta, un algoritmo superado) pierde valor con el tiempo mientras el campo avanza.

Si la vida media de una habilidad especializada H = 5 años, entonces después de t años la fracción de valor original que permanece: f(t) = (1/2)^(t/H) = 2^(−t/H).

Después de una vida media (5 años): 50% permanece. Dos vidas medias (10 años): 25%. Tres (15 años): 12.5%. Cuatro (20 años): 6.25%.

La implicación de Hamming: el valor de aprender cómo aprender se compone positivamente con el mismo exponente que el conocimiento especializado decae. Invertir en estrategia de aprendizaje, encuadre de problemas, & razonamiento transferible preserva valor a través de ciclos de vida media.

La experiencia de una ingeniera de software en un framework específico tiene una vida media de 4 años. Ella tiene 12 años hasta el retiro. ¿Qué fracción del valor de esa experiencia permanece al retiro? Luego interpreta: ¿qué sugiere esto sobre cómo debe asignar tiempo de aprendizaje entre especialización profunda y habilidades transferibles?

Geometría, Corrección de Errores, & Carrera

Las tres estructuras geométricas de esta lección parecen desconectadas. Se conectan.

La distancia de Hamming formaliza el costo del error y la redundancia necesaria para recuperarse de él. Cada sistema de comunicación, cada base de código, cada cuerpo de conocimiento necesita suficiente redundancia que errores únicos no corrompan el todo.

El argumento √n vs n traduce visión en un hecho geométrico: la desviación escala como distancia desde un punto de partida, el movimiento dirigido escala como desplazamiento hacia una meta. La redundancia en estrategia de carrera — mantener múltiples líneas de investigación abiertas — amortigua contra el giro ocasional incorrecto.

El crecimiento & decaimiento exponencial rigen tanto la frontera expansiva como la vida media de lo que sabes hoy. La única inversión estable: aprender cómo aprender, que se compone en la misma escala de tiempo que el conocimiento especializado decae.

Conecta al menos dos de estas tres ideas geométricas a una decisión única y concreta que enfrentes en tu campo o carrera. La conexión debe ser específica: nombra la decisión, nombra la estructura geométrica, & explica qué la geometría te dice que hagas diferente que sin ella.