ماذا يعني تناسب النموذج حقًا
نموذج إشكالية يقدم دعوة رياضية: أن إخراج النظام الفعلي يقع على (أو بالقرب من) سطح معين M في فضاء المراقبة.
ينتج النظام الفعلي بمراقبة y₁, y₂, ..., yₙ. التنبؤ بالنماذج قيم ŷ₁, ŷ₂, ..., ŷₙ.
النقاط الناتجة كمسافات: rᵢ = yᵢ - ŷᵢ. كل نقطة ناتجة تقيس المسافة بين مراقبة وتنبؤ النموذج المتعلق بها. في فضاء مراقبة n-ابعاد، تكون النقاط الناتجة متجهة r = y - ŷ.
تناسب الأقل سقاطة: اختر معلمات النموذج لتنميط ||r||² = Σrᵢ². جبريًا، ابحث عن النقطة ŷ على سطح النموذج M الأقرب إلى جسم المراقبة y في مسافة إقليدية.
عندما تضل النقاط الناتجة
||r||² صغير لا يضمن نموذج صحيح. هناك طريقتان نظاميتين للفشل:
1. التأثير النظامي: النقاط الناتجة rᵢ صغيرة ولكنها إيجابية جميعها (أو سالبة جميعها). النموذج يتنبأ بشكل متكرر بشكل أقل أو أكثر. جبريًا: ŷ يقع على سطح إزاحة موازي للمانيفولد الحقيقي للبيانات - قريب في المسافة، خاطئ في الهيكل.
2. المانيفولد الخاطئ: النقاط الناتجة صغيرة لأن النموذج يحتوي على معلمات حرة كافية لتناسب البيانات التدريب بالضبط (التدريب الزائد). سطح النموذج يمر عبر نقاط البيانات، لكن يلتف بينها بشكل سيئ. التنبؤات على بيانات جديدة سيئة.
كشف التأثير النظامي
نموذج مع متوسط نقطة ناتجة صفر قد يكون لديه تأثير نظامي يختلف باختلاف متغير المدخلات.
مثال: نموذج الطقس الذي يقلل من درجة الحرارة بنسبة 2 درجة مئوية في الصيف ويفرضها بنسبة 2 درجات مئوية في الشتاء لديه نقطة ناتجة متوسطة تقريبًا ≈ 0 عبر عام كامل، لكن التأثير المحدد بالطبع.
فحص نقطة ناتجة: قم بتعريض rᵢ لجميع متغيرات المدخلات. نمط مستو (بدون اتجاه) يلفت إلى أن هناك تأثيرًا نظاميًا ينتج عن ذلك المتغير. نمط اتجاهي يكشف عن بعد مفقود في النموذج.
سؤال التحقق لهمنج - "هل يمكن أن يفتقد تأثير صغير但 مهم؟" - يترجم الهندسيًا: هل يحتوي المتجه الباقي على مكون في اتجاه لم يتم تشكيله من قبل فضاء المتغيرات للموديل؟
الانحياز النظامي مقابل الضجيج العشوائي
تأثير هاوثورن: يغير الأفراد في الدراسة سلوكهم بسبب معرفتهم بأنهم يراقبون، وليس بسبب العلاج التجريبي.
التفسير الهندسي
يحيا البيانات الحقيقية M في فضاء يتم تشكيله بواسطة المتغيرات (x₁, x₂, ..., xₖ, سياق الملاحظة).
يتجاهل النموذج سياق الملاحظة. يتناسب معها سطح في (x₁, ..., xₖ) فقط.
عندما يكون سياق الملاحظة = 'يتم دراسته'، تتحرك النقاط البيانية الفعلية على محور سياق الملاحظة. السطح للنموذج - ثابت في فضاء (x₁, ..., xₖ) - يتناسب الآن مع البيانات المتحركة. يظهر الحاصل الجزئي صغير (السطح لا يتناسب بشكل جيد خارج سياق الدراسة)، لكن التوقعات في السياق غير المراقب تكون خاطئة بشكل نظامي.
الهندسة: السطح للنموذج قريب من منحدر البيانات في سياق الدراسة، لكن بعيد عن منحدر الواقع. المسافة بينهما: الانحياز الهاوثورن على محور سياق الملاحظة.
تطلب همنج للنظر في الظروف المزدوجة: منع ارتباط سياق الملاحظة بالعلاج. هذا يبقي منحدر الواقع ومنحدر سياق الدراسة متطابقين - يزيل الانحياز الهندسي.
تأثيرات الأبعاد المخفية الأخرى
كلاً منهم يؤثر على النظام ولكن يتم استبعاده من النموذج مما يؤدي إلى إنشاء نفس التركيب الجيومتري:
- تأثيرات الموسم المنسية في النماذج الاقتصادية
- سلوك المشغل المنسى في محاكاة التصنيع
- حالة إصدار البرمجيات المفقودة في النماذج الأداء
يتوافق النموذج مع سطح أقل بعداً في البيانات التي تعيش على منحدر أعلى بعداً. سيكون البقايا صغيرة في الاتجاهات التي يقيّمها النموذج، كبيرة في الاتجاهات غير المقاسة.
التحقق من صحة التحديد الجيومتري
تحقق هامنج من القائمة الموجودة في الجدول، إعادة صياغتها كجغرافيا:
هل يدعم النظرية الخلفية القوانين المفترضة؟ هل يغطي بعدو المعالم الخاص بنموذج المعطيات المكان المنحدر الحقيقي؟ إذا كان هناك متغيرات مهمة مفقودة (مستبعدة الأبعاد)، لن يتم توجيه سطح النموذج نحو الواقع.
هل متاح التحقق من الصحة الداخلي؟ قوانين الحفاظ الجيوميترية: يجب أن تعيش البيانات على منحدر محدد يحدده قانون الحفاظ على الكتلة، وقانون الحفاظ على الطاقة، إلخ. إذا خرجت المحاكاة من هذه القوانين، فقد تركت المكان المنحدر الصحيح.
التحقق من الصحة عبر التأكد من المعرفة الماضية: يجب أن يمر سطح النموذج عبر نقاط التحقق التاريخية - ليس فقط تلاشي البيانات التدريب، بل تكرارها للاستخدام خارج النماذج.
هل المحاكاة مستقر؟ إذا كانت المحاكاة مستقرة، ستظل قريبة من منحدر المعطيات الحقيقي حتى مع التغييرات الصغيرة. إذا كانت المحاكاة غير مستقرة، ستترك الجوار من المنحدر والنموذج لن يتم استدعاؤه نموذجًا صحيحًا.
عندما تصبح التنبؤات مشروعية
دعم هامنج للطريقة السيناريوهية في المجالات التي يكون التنبؤ فيها مستحيلاً: بدلاً من القول "سيفعل النظام شيئًا مثل X"، قدم مجموعة من مسارات المحتملة بناءً على مجموعة مختلفة من فرضيات الأكواد.
التفسير الهندسي
يتحدد سطح النموذج M(θ) بمتغيرات θ (الفرضيات حول القوانين، الدقائق، الشروط الحدودية). يُحدِد مجموعات الفرضيات المختلفة θ₁، θ₂، ...، θₖ سطوحًا مختلفة M(θ₁)، ...، M(θₖ).
الحائط السيناريوهي هو اتحاد هذه السطوح: المنطقة من فضاء الخروجات التي يمكن أن تنتجها أي من نماذج السيناريوهات.
تنبؤ واحد يدعي: يجب أن تقع النتيجة الحقيقية بالقرب من M(θ) للتقدير الأفضل تقديرًا θ. طريقة السيناريوهات تدعي: يجب أن تقع النتيجة الحقيقية في مكان ما داخل الحائط.
متى يكون الحائط مفيدًا
إذا كان الحائط ضيقًا - تتفق جميع السيناريوهات على الخروجة رغم اختلاف الفرضيات - فإن الثقة بالتنبؤ عالية. إذا كان الحائط واسعًا - تنتج الفرضيات المختلفة خروجات مختلفة جدًا - فإن النموذج حساس جدًا للفرضيات. تلك الحساسية هي الخروجة، وليس نمطًا من أخطاء التشغيل.
دعوة هامنج حول تنبؤاته الخاصة: كان يقدّم سيناريوهات، وليس تنبؤات نقطة. المستقبل الذي وصف هو "ما يحدث معقولاً في رأيي"، وليس توقعات دقيقة.
التداخل مع الواقع
يتحقق النموذج السيناريوهي عندما يقع الواقع داخل الحائط. هذا اختبار أضعف من التنبؤ النقطة لكن أكثر صدقًا حول ما يمكن للنموذج القول.
دمج النماذج الصحيحة وجيومتريتها
有效模拟的几何归结为三个对齐:
1. 参数空间覆盖真实多维空间:模型的维度包括所有驱动系统的变量。隐藏维度的差距产生系统偏差。
2. 稳定性使轨迹接近真实多维空间:收敛方向场意味着误差减小。分散的场意味着模拟离开有效区域。
3. 残差小且无结构:随机、无相关性残差表明模型捕捉到了真实多维空间。具有结构残差(趋势、模式)表明缺少维度。
Hamming的'谁应该相信模拟?'在几何上翻译为:模型表面与现实多维空间的距离有多近,具有多少维度,具有多大的稳定性,以及在多个外样本点上进行了验证?