English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

ضيف
1 / ?

كيف يحصل الذكاء على توزيع طبيعي

يبدأ هامينج الفصل 29 بتحليل دقيق لاختبارات الذكاء.

الدعوى: الذكاء يتبع توزيعاً طبيعياً في السكان. القياس: رسم النقاط على مقياس احتمالية تراكمية (ورقة احتمالية). تقع الدرجات على خط مستقيم — مما يشير إلى توزيع طبيعي.

المشكلة التي يحددها هامينج: هذا ليس اكتشافاً. إنها بناء. يتم معايرة اختبار الذكاء بأخذ الدرجات الخام وتطبيق تحويل رتيب يفرض التوزيع التراكمي على مقياس الاحتمالية الطبيعي. ثم يتم إعلان الدرجات الناتجة بأنها تقيس الذكاء، والذي يُعرّف بأنه ما يقيسه الاختبار المعايرة.

النتيجة: الذكاء، كما يعرّفه هذا الاختبار، يتبع توزيعاً طبيعياً. بالطبع هو كذلك — تم تصميمه ليكون كذلك. التوزيع الطبيعي ليس خاصية للذكاء في العالم؛ إنها خاصية لإجراء المعايرة.

تعميم هامينج: تحصل على ما تقيسه. الأداة، وإجراء المعايرة، والتعريف ليست مستقلة عن بعضها. تشكل حلقة مغلقة. ما تقيسه الأداة يصبح تعريفاً لما هو حقيقي.

مثاله في اختبار حساب التفاضل والتكامل: يمكنه إنتاج أي توزيع تقريباً للدرجات يريده بالاختيار من التوزيع الصعوبة للأسئلة. اختبار موحد الصعوبة ينتج توزيعاً ثنائي الذروة (الطلاب إما يعرفونها أو لا). اختبار مختلط ينتج منحنى جرس. التوزيع هو عاهة تصميم الاختبار، وليس اكتشافاً عن الطلاب.

قانون جودهارت: عندما تصبح المقاييس أهدافاً

إيجاد الحلقة الدائرية

يكشف تحليل هامينج عن تعريف دائري ثلاثي الخطوات:

1. صمّم أداة وإجراء معايرة.

2. عرّف البناء كـ 'ما تقيسه هذه الأداة.'

3. أبلغ عن أن البناء له الخاصية التوزيعية المصممة في المعايرة.

ابحث عن نظام قياس أو تصنيف في مجال تعرفه حيث تعمل نفس الحلقة الدائرية: الأداة أو الإجراء مصمم لإنتاج نتيجة معينة، وبعد ذلك يتم الإبلاغ عن هذه النتيجة كاكتشاف عن العالم. حدد الخطوات الثلاث (الأداة، التعريف، الاكتشاف المبلغ عنه) وشرح كيفية أن الدائرية يمكن أن تضلل شخصاً لا يعرف تاريخ المعايرة.

عندما يصبح المقياس هدفاً

صياغة هامينج، قبل أن يسميها جودهارت: عندما تستخدم مقياساً كهدف، يتوقف عن كونه مقياساً صالحاً. الفعل المتمثل في الاستهداف يفسد المقياس.

الآلية: قبل الاستهداف، يرتبط المقياس بالقيمة الكامنة. بعد الاستهداف، يقوم الممثلون العقلانيون بتحسين المقياس مباشرة. ينقطع الارتباط لأن أسهل طريقة لتحسين المقياس غالباً ما تكون فصله عن القيمة الكامنة.

حالات هامينج:

- عدد الجثث في فيتنام: يُستخدم كمقياس للتقدم العسكري. حسّن الجنود عدد الجثث بحساب أشياء غير قابلة للتحقق. ارتفع المقياس؛ التقدم العسكري لم يرتفع.

- نمو الناتج القومي: يُستخدم كمقياس للرفاهية الاقتصادية. يمكن تحقيق نمو الناتج القومي بإنتاج أشياء ذات قيمة سلبية (تنظيف التلوث، التراكم العسكري، بناء السجون). المقياس انفصل عن الرفاهية.

- درجات الاختبار: يُستخدم كمقياس للتعلم. تعلّم المدارس من أجل الاختبار. ارتفعت الدرجات؛ قد لا يرتفع فهم موضوع المادة الأساسية.

حل هامينج: (1) غيّر المقياس بانتظام، قبل أن يقوم الناس بتحسينه بشكل كامل؛ (2) استخدم مقاييس متعددة في نفس الوقت — من الصعب تحسين كل منها في نفس الوقت؛ (3) لا تعتمد على مقياس واحد لأي قرار مهم.

تحديد آلية الفساد

تقيس منظمة برمجيات إنتاجية المطور بحساب أسطر الأكواد (LOC) المكتوبة في الأسبوع. في البداية، يرتبط LOC بالإنتاجية — المطورون النشطون يكتبون أكثر من الخاملين.

صِف على وجه التحديد كيف ينحرف مقياس LOC عندما يُستخدم كهدف أداء. سمّ ثلاثة سلوكيات ملموسة على الأقل يعتمد عليها المطورون العقلانيون لتحسين LOC دون تحسين الإنتاجية. ثم صف بديل متعدد المقاييس يكون من الصعب تحسينه، وشرح السبب في أنه من الصعب تحسينه.

مشكلة النطاق الديناميكي

يثير هامينج مشكلة قياس خفية: مقاييس التقييم لها نطاق ديناميكي، ومعظم الناس لا يستخدمونه.

مثال: مقياس 1-10 حيث 5 متوسط. معظم المقيّمين يستخدمون 4، 5، و 6، لا يتجاوزون أبداً إلى 1 أو 9. النطاق الديناميكي لتقييماتهم هو 3 فعلياً (من 4 إلى 6)، رغم أن المقياس يوفر 10.

العاقبة: مقيّم يستخدم النطاق الكامل له تأثير 3× على متوسط التقييم من واحد يضغط على المنتصف. إذا قيّمت شيئاً تكره كـ 2 (نطاق كامل) بينما المقيّم الآخر يعطي ما يعجبهم 6 (نطاق مضغوط)، المتوسط هو 4 — كرهك يفوق إعجابهم رغم أن كلا منهما لهما صوت متساوٍ في تصميم نظام التقييم.

اتصال هامينج بنظرية المعلومات: الإنتروبيا (المفاجأة المتوسطة) للتوزيع تُعظّم عندما يكون التوزيع موحداً. مقياس التقييم حيث تُستخدم جميع الدرجات بالتساوي يوصل أقصى معلومات. مقياس حيث معظم التقييمات متجمعة في 5 ينقل جداً قليلاً — التقييمات تحمل تقريباً أي معلومات.

نصيحته العملية: استخدم النطاق الديناميكي الكامل لأي مقياس يُسند إليك. إذا أُعطيت مقياساً من 1 إلى 10، لا تعامله كـ 1 إلى 6. فعل هذا يقلل تأثيرك ويقلل محتوى المعلومات لتقييماتك.

المعلومات والنطاق الديناميكي

يصنّف أستاذان على مقياس 0-100. الأستاذ أ يستخدم فقط النطاق 70-90 (يضغط إلى 20 نقطة). الأستاذ ب يستخدم النطاق الكامل 0-100 (يستخدم 100 نقطة). افترض أن توزيع درجات كل أستاذ موحد داخل نطاقهما المستخدم.

باستخدام صيغة الإنتروبيا H = log₂(n) لتوزيع موحد على n نتائج متساوية الاحتمالية، احسب محتوى المعلومات (بالبتات) لدرجة واحدة من كل أستاذ. كم مرة أكثر معلومات تحمل درجة الأستاذ ب من درجة الأستاذ أ؟ ماذا يعني هذا لجنة قبول الدراسات العليا التي تتلقى درجات من كلا الأستاذين؟