un — Hamming Cap. 27: Datos No Confiables

un

invitado

1 / ?

volver a las lecciones

El Maletín Del Estadístico

Hamming abre el Capítulo 27 con una historia. Un amigo estadístico de Bell Labs sospechaba que las mediciones en un estudio eran inexactas. Discutió con el jefe del departamento, quien se negó a remedir: 'los instrumentos tienen placas de latón que dicen que eran tan precisos, y mi gente es confiable'.

El lunes, el estadístico llegó y dijo que había dejado su maletín en el tren y perdido todos sus datos. No había nada que hacer sino remedir. Cuando llegaron las nuevas mediciones, el estadístico presentó los registros originales, revelando cuán inexactos habían sido. No fue popular por ello, pero la inexactitud ahora era innegable.

Hamming obtiene una lección más dura de otro caso: un estudio de patrones de llamadas telefónicas, que eran registrados por el mismo equipo de oficina central que realizaba las llamadas. Un día el estadístico notó una llamada facturada a una oficina central inexistente. Investigando más, encontró que un gran porcentaje de llamadas se conectaban —durante algunos minutos— a oficinas inexistentes. La máquina estaba generando datos incorrectos sobre su propia operación. No puedes confiar en que una máquina recopile datos sobre sí misma correctamente.

Su tercer ejemplo: su hermano en el departamento de contaminación del aire de Los Ángeles, quien encontró que era necesario desmontar, remontar y recalibrar cada nuevo instrumento que recibían, sin importar las afirmaciones del fabricante.

La regla de Hamming: siempre examina los datos cuidadosamente antes de procesarlos. Grafica los datos. Busca patrones que no deberían estar allí. Verifica inconsistencias. No importa cuán urgente sea la respuesta, prueba los datos primero.

Error Aleatorio, Error Sistemático y la Cadena de Calibración

Prueba Previa de Datos

Estudio de inventario de Hamming: recibió 18 meses de registros de inventario para ~100 artículos e ingenuamente creyó la garantía del proveedor de que las inconsistencias habían sido eliminadas. Más tarde en el proyecto, encontró inconsistencias residuales — entradas que no hubieran podido ocurrir sin error (p. ej., retiros del inventario vacío).

Concluyó: 'Primero tuve que encontrarlas, luego eliminarlas, y luego procesar nuevamente los datos. De esa experiencia aprendí a nunca procesar datos sin antes examinarlos cuidadosamente en busca de errores'.

Describe tres controles de consistencia específicos que aplicarías a un nuevo conjunto de datos antes de confiar en él para el análisis. Para cada control, explica qué tipo de error detectaría — y por qué ese tipo de error podría existir en los datos a pesar de las garantías del proveedor.

Dos Tipos De Error

Cada medición física lleva dos tipos de error:

Error aleatorio: variación impredecible alrededor del valor verdadero. Sigue una distribución (frecuentemente aproximadamente gaussiana) centrada en el valor verdadero. Los errores aleatorios se cancelan al promediar: toma suficientes mediciones y la media se aproxima al valor verdadero.

Error sistemático (sesgo): un desplazamiento consistente en una dirección. Todas tus mediciones están desplazadas por la misma cantidad. Ninguna cantidad de promedios lo elimina, porque el promedio de muchas mediciones sesgadas sigue siendo sesgado.

Ejemplo de Hamming de la física: una tabla de las 10 constantes fundamentales (velocidad de la luz, número de Avogadro, carga del electrón, etc.) fue compilada, y luego recompilada 24 años después con instrumentos mejorados. En promedio, los nuevos valores cayeron 5.267 veces fuera de las barras de error antiguas. Esto no es plausible solo por error aleatorio — errores aleatorios tan grandes serían detectables. La explicación: los instrumentos antiguos tenían errores sistemáticos no capturados en la incertidumbre establecida, y las técnicas mismas tenían una falla compartida a través de la comunidad.

Comentario de Shannon: 'La calibración es lo más importante en la medición.' La calibración aborda el error sistemático. Si tu instrumento constantemente lee 3% demasiado alto, ninguna cantidad de mediciones repetidas lo arregla — debes calibrar.

Identificar Error Sistemático

La constante de Hubble: la tasa a la que se expande el universo, medida desde la relación de corrimiento al rojo-distancia de galaxias. Múltiples grupos independientes la han medido en los últimos 50 años. Históricamente, muchos de los valores publicados cayeron fuera de las barras de error de otros valores publicados — lo que significa que los desacuerdos fueron más grandes que lo que las incertidumbres establecidas predecían.

Explica por qué mediciones independientes de la constante de Hubble podrían cada una tener pequeños errores aleatorios establecidos pero aún así estar en desacuerdo por cantidades mayores que esos errores. ¿Qué tipo de error causa este patrón, y cómo lo distinguirías experimentalmente del error aleatorio?

¿Cómo Pruebas Lo Que No Puedes Probar?

Hamming plantea un problema sin solución limpia, pero que cada ingeniero practicante eventualmente enfrenta: ¿Cómo pruebas un dispositivo para confiabilidad cuando la prueba misma toma más tiempo del que tienes, y tu equipo de prueba de vida útil es menos confiable que el dispositivo que estás probando?

El escenario: un dispositivo debe durar 20 años en el campo (175,000 horas). Tu laboratorio de prueba de vida está clasificado para 10,000 horas de operación. Tu presupuesto de período de prueba es 3 meses (aproximadamente 2,000 horas). Se espera que el dispositivo enfrente temperaturas operativas de hasta 85°C en el campo.

Prueba acelerada: ejecuta el dispositivo a 105°C y asume que los fallos ocurren 10× más rápido que a 85°C (una regla común de ingeniería). Entonces 2,000 horas a 105°C 'representa' 20,000 horas a 85°C. ¿Pero es así?

El problema: el modo de fallo a 105°C podría ser diferente al modo de fallo a 85°C. Si las uniones de soldadura fallan por fatiga térmica a 85°C pero por oxidación a 105°C, la prueba acelerada no te dice nada útil sobre la vida útil en el campo.

El consejo de Shannon se aplica: calibración — entender qué mide realmente tu medición — es el paso crítico. La prueba acelerada calibra temperatura contra tasa de fallo solo si el modo de fallo es el mismo. Verificar esto requiere un estudio separado.

Diseña Una Prueba De Vida Útil

Eres un ingeniero de confiabilidad para un dispositivo médico implantado en el cuerpo humano. Debe durar 10 años (87,600 horas). Tu presupuesto de laboratorio permite 6 meses de pruebas (4,380 horas). El dispositivo opera a temperatura corporal (37°C).

¿Cuál es el problema fundamental de simplemente ejecutar pruebas aceleradas a 50°C o 60°C y extrapolar para predecir confiabilidad de 10 años? Describe al menos dos modos de fallo específicos que la prueba acelerada podría perder o caracterizar incorrectamente, y explica qué evidencia adicional recopilarías para validar la extrapolación.