un — Geometria de Hamming

un

visitante

1 / ?

voltar às lições

Distância no Espaço Binário

A contribuição técnica mais famosa de Richard Hamming: códigos corretores de erro. A ideia geométrica por trás deles vai mais fundo do que qualquer código específico.

Distância de Hamming

Dadas duas cadeias binárias de comprimento igual, a distância de Hamming d(u, v) conta as posições onde diferem:

``u = 1 0 1 1 0 v = 1 1 1 0 0 ↑ ↑ d(u,v) = 2``

Isto satisfaz todos os três axiomas métricos: d(u,v) ≥ 0; d(u,v) = 0 iff u = v; d(u,v) = d(v,u); d(u,w) ≤ d(u,v) + d(v,w). O espaço binário n com distância de Hamming forma um espaço métrico válido.

A geometria visualiza-se claramente em dimensões baixas. Todas as cadeias de 3 bits vivem nos 8 vértices de um cubo. Vértices adjacentes nas arestas diferem em exatamente 1 bit; vértices na diagonal da face diferem em 2; vértices antípodas (p.ex. 000 e 111) diferem em 3.

3-bit Hypercube: Hamming Distance

Calculando Distância de Hamming

O peso de Hamming wt(v) conta o número de 1s em v. A distância relaciona-se ao peso via XOR:

d(u, v) = wt(u XOR v)

Exemplo: u = 10110, v = 11100. XOR = 01010. Peso = 2. Então d(u,v) = 2.

Compute d(u, v) para u = 10011101 e v = 11010100. Mostre o passo XOR, depois conte as posições de bits diferentes.

Correção de Erros via Empacotamento de Esferas

Um código binário C ⊆ {0,1}^n consiste em palavras-código escolhidas. Quando uma palavra-código transmite por um canal com ruído, alguns bits podem virar. O receptor recebe uma cadeia corrompida e deve recuperar o original.

Defina uma esfera de Hamming de raio t centrada na palavra-código c:

B(c, t) = { v ∈ {0,1}^n : d(c, v) ≤ t }

Para corrigir até t erros, as esferas B(c, t) em torno de cada par de palavras-código não devem sobreposição. Se se sobrepõem, uma palavra recebida pode estar em duas esferas e o decodificador não consegue determinar qual palavra-código foi enviada.

A distância mínima d_min do código governa tudo:

- Detectar até d_min − 1 erros - Corrigir até ⌊(d_min − 1) / 2⌋ erros

Código Hamming (7,4): n = 7 bits, k = 4 bits de dados, d_min = 3. Corrige 1 erro. Detecta 2.

Error Correction: Sphere Packing

Um código tem distância mínima 5. Quantos erros pode detectar? Quantos pode corrigir? Mostre as fórmulas, depois compute ambos os valores.

Quantas Palavras-Código Cabem?

Quantas palavras-código um código de comprimento-n pode conter enquanto ainda corrige t erros? Cada palavra-código 'possui' uma esfera de raio t. Todas as esferas juntas devem caber em {0,1}^n, que tem 2^n pontos.

Volume de uma esfera de Hamming de raio t em {0,1}^n:

Vol(n,t) = Σ_{i=0}^{t} C(n, i)

O limite de Hamming (limite de empacotamento de esferas) segue diretamente: um código corrigindo t erros satisfaz

M · Vol(n,t) ≤ 2^n

onde M = número de palavras-código. Então M ≤ 2^n / Vol(n,t).

Para o código Hamming (7,4): n=7, t=1. Vol(7,1) = C(7,0) + C(7,1) = 1 + 7 = 8. Limite: M ≤ 128 / 8 = 16. O código (7,4) alcança M = 2^4 = 16: um código perfeito, significando que as esferas pavimentam {0,1}^7 sem lacunas.

Para n = 15 e t = 1 (correção de erro único), compute Vol(15, 1) e o limite de Hamming no número de palavras-código M. M = 2^11 é alcançável dado o limite?

√n vs n

Hamming usou um argumento de passeio aleatório para tornar o valor da visão de longo alcance preciso. O argumento converte uma afirmação vaga — 'visão ajuda' — em um fato geométrico sobre distâncias.

Passeio Aleatório Simétrico em ℤ

A cada passo, mova +1 ou −1 com igual probabilidade. Após n passos, deslocamento esperado do origem: E[|X_n|] ≈ √n.

Isto segue da variância: Var(X_n) = n (passos independentes, cada ±1 variância 1). Desvio padrão = √n.

Passeio Dirigido

A cada passo, mova +1 com probabilidade p > 1/2 (viés em direção a um objetivo). Após n passos, posição esperada: E[X_n] = n(2p−1). Para p = 1 (completamente dirigido): E[X_n] = n.

O contraste: deriva aleatória escala como √n; progresso dirigido escala como n.

Random Walk vs Directed Walk

Tradução de Hamming

Em uma carreira de pesquisa, cada dia de trabalho representa um passo. Sem uma visão clara do que importa, o trabalho deriva em muitas direções: após n dias, progresso líquido ≈ √n. Com uma visão coerente de longo alcance, o esforço se alinha: após n dias, progresso líquido ≈ n. A razão n / √n = √n cresce sem limites.

A Razão √n

O passeio dirigido não requer pontaria perfeita. Qualquer viés persistente em direção a um objetivo converte deriva √n em algo mais próximo ao progresso n.

Hamming disse que uma pessoa com visão clara realiza aproximadamente √n vezes mais ao longo de uma carreira do que uma sem, onde n é o número de dias de trabalho. Se uma carreira abrange 10.000 dias de trabalho, qual razão isto prevê? O que o número sugere sobre o valor prático da visão sustentada?

Limitações do Modelo

Um modelo que prevê 100x de saída a partir de visão merece escrutínio. Várias coisas que omite:

1. Dimensionalidade: carreiras operam em espaço de alta dimensão, não ℤ. A geometria de um passeio aleatório em ℝ^d muda significativamente com d.

2. Correlação: passos de pesquisa correlacionam — o trabalho de hoje constrói sobre o de ontem. Passeios correlacionados comportam-se diferentemente de passos i.i.d.

3. A visão em si pode estar errada: um passeio dirigido em direção ao atrator errado é pior que deriva.

Identifique uma suposição na qual o argumento √n vs n depende que você considere mais suspeita em carreiras de pesquisa reais. Explique por que essa suposição importa para a previsão de 100x.

Tempo de Duplicação

Hamming abriu seu curso com a afirmação de que o conhecimento técnico duplica aproximadamente a cada 17 anos. Essa afirmação tem uma estrutura matemática precisa: crescimento exponencial.

Modelo de Crescimento Exponencial

y(t) = a · e^(b·t)

onde a = quantidade inicial em t = 0, b = taxa de crescimento (por unidade de tempo), e ≈ 2.718.

Tempo de duplicação D: o tempo para y duplicar.

2a = a · e^(b·D) → 2 = e^(b·D) → ln(2) = b·D → D = ln(2) / b

ln(2) ≈ 0.693. Para b = 0.693/17 ≈ 0.0408 por ano, tempo de duplicação = 17 anos.

Meia-Vida

Meia-vida H: tempo para y decair para metade do seu valor (b < 0).

H = ln(2) / |b|

A mesma fórmula em ambas as direções. Uma habilidade com meia-vida 5 anos: após 5 anos, metade do seu valor de mercado desapareceu. Após 10 anos: um quarto permanece. Após 20 anos: menos de 7% permanece.

Duplicação de Conhecimento

Se o conhecimento técnico duplica a cada 17 anos, um estudante graduado aos 22 enfrenta uma paisagem de conhecimento transformada aos 56 — uma carreira de 34 anos abrange duas duplicações completas.

Usando D = ln(2) / b, compute a taxa de crescimento anual b implicada por um tempo de duplicação de 17 anos. Depois use y(t) = e^(b·t) para encontrar o fator pelo qual a base de conhecimento multiplica ao longo de uma carreira de 34 anos. Mostre seu trabalho.

Meia-Vida da Expertise

O mesmo modelo exponencial aplica-se a decaimento. Uma habilidade específica (p.ex. domínio de uma arquitetura de chip particular, uma API descontinuada, um algoritmo superado) perde valor ao longo do tempo conforme o campo avança.

Se a meia-vida de uma habilidade especializada H = 5 anos, então após t anos a fração do valor original permanecendo: f(t) = (1/2)^(t/H) = 2^(−t/H).

Após uma meia-vida (5 anos): 50% permanece. Duas meias-vidas (10 anos): 25%. Três (15 anos): 12,5%. Quatro (20 anos): 6,25%.

Implicação de Hamming: o valor de aprender como aprender compõe positivamente com o mesmo expoente que conhecimento especializado decai. Investir em estratégia de aprendizado, encuadrement de problemas, & raciocínio transferível preserva valor através de ciclos de meia-vida.

A expertise de um engenheiro de software em um framework específico tem uma meia-vida de 4 anos. Ele tem 12 anos até a aposentadoria. Que fração do valor dessa expertise permanece na aposentadoria? Depois interprete: o que isto sugere sobre como ele deveria alocar tempo de aprendizado entre especialização profunda e habilidades transferíveis?

Geometria, Correção de Erros & Carreira

As três estruturas geométricas dessa lição parecem desconectadas. Elas se conectam.

Distância de Hamming formaliza o custo do erro e a redundância necessária para recuperar-se dele. Todo sistema de comunicação, todo repositório de código, todo corpo de conhecimento precisa de redundância suficiente para que erros únicos não corrompam o todo.

O argumento √n vs n traduz visão em um fato geométrico: deriva escala como distância de um ponto inicial, movimento dirigido escala como deslocamento em direção a um objetivo. Redundância em estratégia de carreira — manter múltiplas linhas de investigação abertas — amortece contra a ocasional volta errada.

Crescimento e decaimento exponencial governam tanto a fronteira expandindo quanto a meia-vida do que você sabe hoje. O único investimento estável: aprender como aprender, que compõe na mesma escala de tempo que conhecimento especializado decai.

Conecte pelo menos duas dessas três ideias geométricas a uma única decisão concreta que você enfrenta em seu campo ou carreira. A conexão deveria ser específica: nomeie a decisão, nomeie a estrutura geométrica, e explique o que a geometria diz para você fazer diferentemente do que faria sem ela.