un — 해밍 29장: 측정하는 것을 얻는다

un

게스트

1 / ?

수업 목록으로

IQ가 정규분포를 얻는 방식

해밍은 29장을 IQ 검사의 신중한 분석으로 시작한다.

주장: 지능은 인구 집단에서 정규분포를 따른다. 측정: 누적 확률 척도(확률 용지) 위에 점수를 표시한다. 점수들이 직선 위에 떨어진다 — 정규분포를 나타낸다.

해밍이 식별하는 문제: 이것은 발견이 아니다. 이것은 구성이다. IQ 검사는 보정된다: 원점수를 취하고 누적분포를 정규 확률 척도에 강제하는 단조 변환을 적용함으로써. 그러면 결과 점수는 지능을 측정한다고 선언된다. 지능은 보정된 검사가 측정하는 것으로 정의된다.

결과: 지능, 이 검사가 측정하는 것으로 정의되는, 정규분포한다. 당연하다 — 그렇게 설계되었기 때문이다. 정규분포는 세계의 지능의 성질이 아니다. 그것은 보정 절차의 성질이다.

해밍의 일반화: 측정하는 것을 얻는다. 기기, 보정 절차, 정의는 독립적이지 않다. 그들은 닫힌 루프를 형성한다. 기기가 측정하는 것이 무엇이 실재인지의 정의가 된다.

그의 미적분 시험 예: 문제의 난이도 분포를 선택함으로써 그는 원하는 거의 모든 성적 분포를 만들 수 있다. 균일하게 어려운 시험은 쌍봉형 분포를 낳는다(학생들은 알거나 알지 못한다). 혼합 시험은 종 모양을 낳는다. 분포는 시험 설계의 인공물이다. 학생들에 대한 발견이 아니다.

굿하트의 법칙: 지표가 목표가 될 때

순환 루프 찾기

해밍의 분석은 세 단계의 순환적 정의를 드러낸다:

1. 기기와 보정 절차를 설계한다.

2. 구성을 '이 기기가 측정하는 것'으로 정의한다.

3. 구성이 보정에 설계된 분포적 성질을 가진다고 보고한다.

당신이 알고 있는 분야에서 같은 순환 루프가 작동하는 측정 또는 분류 시스템을 찾아라: 기기나 절차는 특정 결과를 산출하도록 설계되고, 그러면 그 결과는 세계에 대한 발견으로 보고된다. 세 단계(기기, 정의, 보고된 발견)를 식별하고, 보정 역사를 알지 못하는 사람이 어떻게 순환성에 의해 오도될 수 있는지 설명하라.

측정이 목표가 될 때

굿하트가 이름 붙이기 전의 해밍의 공식: 측정을 목표로 사용할 때, 그것은 유효한 측정이기를 멈춘다. 목표 지정의 행위는 지표를 부패시킨다.

메커니즘: 목표 지정 전에, 지표는 기본 값과 상관관계를 가진다. 목표 지정 후에, 합리적 행위자는 지표를 직접 최적화한다. 상관관계가 끊어진다. 지표를 개선하는 가장 쉬운 방법은 종종 기본 값으로부터 그것을 분리하는 것이기 때문이다.

해밍의 사례:

- 베트남의 시체 수: 군사 진전의 측정으로 사용되었다. 군인들은 검증할 수 없는 물체를 세어서 시체 수를 최적화했다. 지표는 올랐다. 군사 진전은 그렇지 않았다.

- GNP 성장: 경제적 복지의 측정으로 사용되었다. GNP 성장은 음수 값을 가진 것을 생산함으로써 달성될 수 있다(오염 정화, 군사 증강, 감옥 건설). 지표는 복지로부터 분리되었다.

- 시험 점수: 학습의 측정으로 사용된다. 학교는 시험을 위해 가르친다. 점수는 올른다. 기본 주제에 대한 이해는 그렇지 않을 수 있다.

해밍의 해결책: (1) 사람들이 완전히 최적화하기 전에 지표를 정기적으로 변경하라; (2) 동시에 여러 지표를 사용하라 — 모두를 한 번에 최적화하는 것은 더 어렵다; (3) 중요한 결정을 위해 단일 지표에 절대 의존하지 마라.

부패 메커니즘을 식별하라

소프트웨어 조직은 개발자 생산성을 주당 작성된 코드 라인 수(LOC)로 측정한다. 초기에, LOC는 생산성과 상관관계를 가진다 — 활동적인 개발자는 비활동적인 개발자보다 더 많은 코드를 작성한다.

LOC 지표가 성능 목표로 사용될 때 어떻게 부패하는지 구체적으로 설명하라. 생산성을 개선하지 않으면서 LOC를 최적화하기 위해 합리적인 개발자가 채택할 적어도 세 가지 구체적인 행동을 명명하라. 그러면 부패하기 더 어려운 다중 지표 대안을 설명하고, 왜 더 어려운지 설명하라.

동적 범위 문제

해밍은 미묘한 측정 문제를 제기한다: 등급 척도는 동적 범위를 가지고, 대부분의 사람들은 그것을 사용하지 않는다.

예: 1-10 척도, 여기서 5는 평균. 대부분의 평가자는 4, 5, 6을 사용하고, 1이나 9로 모험을 떠나지 않는다. 그들의 평가의 동적 범위는 효과적으로 3(4에서 6)이다. 비록 척도는 10을 제공한다.

결과: 전체 범위를 사용하는 평가자는 중간으로 압축하는 사람보다 평균화된 평가에 3배의 영향을 미친다. 싫어하는 것을 2로 평가(전체 범위)하고 다른 평가자가 좋아하는 것을 6으로 주는 동안(압축 범위), 평균은 4다 — 당신의 싫음은 둘 다 등급 척도의 설계에서 동등한 목소리를 가졌음에도 불구하고 그들의 좋음을 능가한다.

해밍의 정보 이론 연결: 분포의 엔트로피(평균 놀라움)는 분포가 균등할 때 최대화된다. 모든 등급이 동등하게 사용되는 등급 척도는 최대 정보를 전달한다. 대부분의 평가가 5에 집중하는 척도는 거의 통신하지 않는다 — 평가는 거의 정보를 전달하지 않는다.

그의 실용적 조언: 할당된 모든 척도의 전체 동적 범위를 사용하라. 1에서 10까지의 척도가 주어지면, 그것을 1에서 6까지로 취급하지 마라. 그렇게 하면 당신의 영향과 평가의 정보 내용을 줄인다.

정보와 동적 범위

두 교수는 0-100 척도로 성적을 준다. 교수 A는 70-90 범위(20포인트로 압축)만 사용한다. 교수 B는 전체 범위 0-100(100포인트 사용)을 사용한다. 각 교수의 성적 분포가 그들이 사용하는 범위 내에서 균등하다고 가정하라.

n개의 동등한 확률의 결과에 대한 균등 분포를 위한 엔트로피 공식 H = log₂(n)을 사용하여, 각 교수로부터 단일 성적의 정보 내용(비트)을 계산하라. 교수 B의 성적이 교수 A의 성적보다 얼마나 더 많은 정보를 전달하는가? 이것은 두 교수의 성적을 받는 대학원 입학 위원회에 무엇을 의미하는가?