English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

guest
1 / ?
back to lessons

एक मॉडल को वास्तव में क्या मतलब होता है

एक सिमुलेशन मॉडल एक गणितीय दावा करता है: वास्तविक सिस्टम के आउटपुट्स M में विशेष सतह पर (या इसके पास) लेट होते हैं।

वास्तविक सिस्टम द्वारा य₁, य₂, ..., यₙ नोट्स प्रोड्यूस किए जाते हैं। मॉडल के मानों को ŷ₁, ŷ₂, ..., ŷₙ प्रदान करते हैं।

अवशेषों को दूरियों के रूप में: rᵢ = yᵢ - ŷᵢ। प्रत्येक अवशेष प्रेक्षण और इसके संबंधित मॉडल पूर्वानुमान के बीच एक दूरी को मापता है। n-माने वाले प्रेक्षण स्थान में, अवशेषों का एक वेक्टर r = y - ŷ बनाते हैं।

न्यूनतम-वर्ग फिटिंग: मॉडल परामीटर चुनें जो ||r||² = Σrᵢ² को कम करें। ज्यामितीय रूप से, मॉडल सतह M पर निकटतम प्रेक्षण वेक्टर y के सबसे करीब के बिंदु ŷ को खोजें।

जब अवशेष धोखा देते हैं

छोटा ||r||² वैलिड मॉडल की गारंटी नहीं देता है। दो सिस्टमैटिक फेलियर मोड:

1. सिस्टमैटिक बायास: अवशेष rᵢ छोटे होते हैं, लेकिन सभी सकारात्मक (या सभी नकारात्मक) होते हैं। मॉडल स्थिरता से अंडर-या ओवर-प्रेडिक्ट करता है। ज्यामितीय रूप से: ŷ सतह M के वास्तविक डेटा मैनिफोल्ड के एक समानांतर ऑफसेट सतह पर लेट होता है - दूरी में निकट, संरचना में गलत।

2. गलत मैनिफोल्ड: अवशेष छोटे होते हैं क्योंकि मॉडल ट्रेनिंग डेटा कोexact (ओवरफिटिंग) को फिट कर सकते हैं। मॉडल सतह डेटा पॉइंट्स के बीच क्रैंप करती है।

Residuals, Bias, & Manifold Fitting

सिस्टमैटिक बायास का पता लगाना

एक मॉडल जिसका औसत अवशेष शून्य हो सकता है, लेकिन विभिन्न इनपुट चर पर सिस्टमैटिक बायास होता है जो वेरिएशन करता है।

उदाहरण: एक मौसम का सिमुलेशन जो ग्रीष्मकाल में 2°C का अनुमान करता है और सर्दियों में 2°C का अत्यधिक अनुमान करता है, जिसका अर्थ है कि एक पूरे वर्ष के लिए एक समान अवशेष का औसत लगभग 0 होता है, लेकिन स्पष्ट ऋतु बायास होता है।

अवशेष निर्देशांक: rᵢ के खिलाफ प्रत्येक इनपुट चर का निर्माण करें। एक स्तरीय पैटर्न (कोई प्रवृत्ति नहीं) का संकेत देता है कि उस चर से संबंधित सिस्टमैटिक बायास नहीं है। एक प्रवृत्ति पैटर्न से एक मॉडल में छिपी हुई आयाम का पता चलता है।

हैमिंग की वैलिडेशन प्रश्न - 'क्या एक छोटी但 जरूरी प्रभाव गायब हो सकती है?' - ज्यामितीय रूप से अनुवादित होती है: क्या अवशेष वेक्टर का घटक मॉडल के पैरामीटर स्थान को कवर नहीं करने वाली दिशा में होता ह?

एक रेग्रेशन मॉडल y = ax + b को 4 डेटा पॉइंट्स पर फिट किया जाता है: (1, 3), (2, 5), (3, 8), (4, 9)। फिट की गई रेखा के लिए a = 2, b = 1 होता है, जो पूर्वानुमान ŷ = (3, 5, 7, 9) देता है। अवशेषों की गणना करें। फिर: अवशेष पैटर्न के आधार पर, हैं वे सिस्टमैटिक (एक पैटर्न दिखाते हैं) या वे प्रतीत होते हैं कि वे स्वतंत्र हैं? अवशेष पैटर्न के आधार पर, मॉडल की ज्यामितीय संपत्ति को संशोधित करने के लिए क्या बदला जाना चाहिए?

सिस्टमैटिक ऑफसेट व्स रैंडम नॉइस

हॉथोर्ने प्रभाव: एक अध्ययन में विषयों का व्यवहार इसलिए बदल जाता है क्योंकि उन्हें पता है कि उन्हें देखा जा रहा है, नहीं क्योंकि प्रयोगशाला उपचार के कारण।

ज्यामितीय व्याख्या

वास्तविक डेटा मानचित्र M (x₁, x₂, ..., xₖ, observation_context) के स्थान को स्पेन करता है।

मॉडल observation_context को नज़रअंदाज करता है। वह (x₁, ..., xₖ) के अवलोकनों को फिट करता है।

जब observation_context = 'being studied,' वास्तविक डेटा बिंदु observation_context अक्ष पर शिफ्ट होते हैं। मॉडल का सतह - फिक्स्ड (x₁, ..., xₖ) स्थान में - अब observation_context के अवलोकन के संदर्भ में सही डेटा को फिट करता है। अवशेष छोटे (सतह अभी भी अध्ययन के संदर्भ में अच्छी तरह से फिट होती है) लेकिन अनावलोकन कॉनटेक्स्ट में भविष्यवक्तियां सिस्टमैटिक रूप से गलत हैं।

ज्यामिति: मॉडल सतह अध्ययन-संदर्भ डेटा मानचित्र के करीब है, लेकिन वास्तविकता मानचित्र से दूर है। उनके बीच की दूरी: हॉथोर्ने ऑफसेट के रूप में observation_context अक्ष पर।

हैमिंग का डबल-ब्लाइंड अनुरोध: अवलोकन कॉनटेक्ट को उपचार के साथ संबंधित होने से रोकें। यह वास्तविकता मानचित्र और अध्ययन-संदर्भ मानचित्र को संगत करता है - जिम्मेदार व्याख्या को समाप्त करता है।

अन्य छिपे हुए-आयाम प्रभाव

किसी भी चर को छोड़ दें जो प्रणाली को प्रभावित करती है लेकिन मॉडल से बाहर होती है, यह समान भौगोलिक संरचना पैदा करती है:

- आर्थिक मॉडल से बचे गए मौसमीय प्रभाव

- निर्माण सिमुलेशन से बाहर रखी गई ऑपरेटर की व्यवहार

- प्रदर्शन मॉडल से अनुपस्थित वेरिएबल स्टेट सॉफ्टवेयर वर्जन

मॉडल डेटा को जो उच्च-आयामी मानifold पर रहता है, उसे एक निम्न-आयामी सतह को ढूंढता है। अवशेष मॉडल द्वारा मापी गई दिशाओं में छोटे होंगे, अनुमापी दिशाओं में बड़े होंगे।

सत्यापन के रूप में भौगोलिक संरेखण

हैमिंग की सत्यापन सूची को भौगोलिक रूप में पुनर्निर्देशित किया गया:

पृष्ठभूमि का सिद्धांत माना जाता है कि संभावित नियमों का समर्थन करता है? मॉडल के पैरामीटर स्थान के आयामों ने वास्तविक डेटा मानिफोल्ड को कवर किया है? अगर महत्वपूर्ण चर मissing (छोड़े गए आयाम) हैं, तो मॉडल की सतह वास्तविकता से संरेखित नहीं कर सकेगी।

अंतर्निहित जाँच उपलब्ध हैं? संरक्षण कानून भौगोलिक सीमाएँ हैं: डेटा को मास की संरक्षण, ऊर्जा की संरक्षण आदि द्वारा परिभाषित एक विशेष उप-मानिफोल्ड पर रहना चाहिए। अगर सिमुलेशन इन्हें लागू नहीं करता है, तो इसकी ट्रेसकी इन्हें छोड़ देती है वैध उप-मानिफोल्ड से।

पूर्व में ज्ञात अनुभव के साथ क्रॉस-चेक: मॉडल सतह को ऐतिहासिक सत्यापन बिंदु से गुजरना चाहिए - केवल प्रशिक्षण डेटा को फिट करना बल्कि सामान्यीकृत करना चाहिए out-of-sample अवलोकन।

सिमुलेशन स्थिर है? एक स्थिर सिमुलेशन मानिफोल्ड के आसपास के वास्तविक समाधान क्षेत्र में छोटे परिवर्तनों के बावजूद बना रहता है। एक अस्थिर सिमुलेशन मानिफोल्ड के पड़ोस को छोड़ देता है और इसे वैध मॉडल नहीं कहा जा सकता।

हैमिंग ने ध्यान दिया कि व्यापार सिमुलेशन और युद्धाभ्यास में, जो लोग जानते हैं कि वे एक सिमुलेशन में हैं, उनका व्यवहार बदल जाता है - जिससे सिमुलेशन को वास्तविक व्यवहार का अस्थिर मॉडल बनाने में असमर्थ बना देता है। इस मामले में सिमुलेशन को असफल बनाने वाली भौगोलिक संपत्ति को पहचानें (केवल 'हॉथोर्न इफेक्ट' नहीं - भौगोलिक संरचना का वर्णन करें)। फिर ऐसा प्रस्तावित करें कि जो डबल-ब्लाइंड स्थिति की आवश्यकता नहीं हो सकती है, उसे सिमुलेशन-वास्तविकता की खाई का पता लगाने के लिए सत्यापन परीक्षण का उपयोग करें।

पूर्वानुमान प्रक्षेपण बन जाता है

हैमिंग ने स्केनरियो विधि का समर्थन किया जहां पूर्वानुमान संभव नहीं था: बजाय 'प्रणाली X करेगा' कहने के, विभिन्न धारणा सेटों के तहत संभव मार्गों की एक सेट प्रस्तुत करें।

ज्यामितीय व्याख्या

मॉडल सतह M(θ) धारणा के बारे में विचारों (कानून, स्थिरांक, सीमा स्थितियों) के परिमिति θ पर निर्भर करती है। विभिन्न धारणा सेट θ₁, θ₂, ..., θₖ विभिन्न सतहों M(θ₁), ..., M(θₖ) परिभाषित करते हैं।

स्केनरियो पर्दा इन सतहों के संघ: किसी भी स्केनरियो मॉडल को निर्मित कर सकने वाले आउटपुट स्थान का क्षेत्र है।

एकल पूर्वानुमान दावा: वास्तविक परिणाम θ के सर्वोत्तम अनुमान θ के लिए M(θ) के पास में होगा। स्केनरियो विधि कहती है: वास्तविक परिणाम पर्दे के भीतर कहीं भी होगा।

जब पर्दा उपयोगी होता है

यदि पर्दा संकीर्ण होता है - सभी स्केनरियो आउटपुट के बावजूद धारणा सेटों के विभिन्न होने के बावजूद विश्वास होता है - पूर्वानुमान की आत्मविश्वास होती है। यदि पर्दा व्यापक होता है - विभिन्न धारणा सेटों के तहत बहुत अलग आउटपुट का निर्माण करते हैं - मॉडल धारणा के प्रति संवेदनशील होता है। उस संवेदनशीलता को निरस्तीकरण मोड नहीं है।

हैमिंग का दावा अपने अपने पूर्वानुमानों के बारे में: उन्होंने स्केनरियो दिए थे, नहीं टिप पूर्वानुमान। वह भविष्य जिसे उन्होंने वर्णित किया वह 'मेरी राय में होने वाला कुछ होगा', नहीं एक सटीक भविष्यवाणी।

वास्तविकता का टकराव

एक स्केनरियो मॉडल तब सत्यापित होता है जब वास्तविकता पर्दे के भीतर गिरती है। यह बिंदु पूर्वानुमान की तुलना में कम बल्कि मॉडल के दावों के बारे में अधिक ईमानदार है।

संयोजन: वैध मॉडल और उनकी ज्यामिति

वैध सिमुलेशन की ज्यामिति तीन समन्वयों में आती है:

1. परिमाण स्थान प्रति वास्तविक मानचित्र को कवर करता है: मॉडल के आयाम सभी प्रणाली को निर्देशित करने वाले चरों को शामिल करते हैं। छिपी हुई आयाम की कोई भी क्षति प्रणालीगत विषमता उत्पन्न करती है।

2. स्थिरता वास्तविक मानचित्र के पास की ओर ट्रैक को रखती है: एक संगत दिशा क्षेत्र अर्थों को सिकुड़ता हुआ मतलब है कि त्रुटियां घटती हैं। एक विचलन क्षेत्र माना जाता है कि सिमुलेशन वैध क्षेत्र से बाहर जाता है।

3. अवशेष छोटे होते हैं और अनविन्यस्त होते हैं: स्वतंत्र, अनुक्रमित अवशेष सुझाव देते हैं कि मॉडल वास्तविक मानचित्र को पकड़ रहा है। संरचित अवशेष (पATTERNS) संकेत देते हैं कि एक छिपा हुआ आयाम है।

हैमिंग्स 'क्यों किसी को भी सिमुलेशन की विश्वास होना चाहिए?' ज्यामितीय रूप से अनुवाद करता है: मॉडल सतह और वास्तविक मानचित्र के बीच कितना करीब है, कितने आयामों में, किस तरह की स्थिरता है, और बाहरी नमूने के आधार पर कितना सत्यापित किया गया है।

आप एक मॉडल बना रहे हैं जो प्रत्याशित करता है कि पुल निर्माण परियोजना समय पर पूरी होगी। आपका मॉडल उपयोग करता है: योजनाबद्ध अवधि (सप्ताह), टीम का आकार (व्यक्ति), और बजट अनुपात (वास्तविक / योजनाबद्ध)। एक साथी तर्क देते हैं कि आप महत्वपूर्ण चरों को निकाल रहे हैं। इस पाठ के इस अंश से जुड़े ज्यामितीय ढांचे का उपयोग करके, एक ऐसे चर का वर्णन करें जो भविष्यवक्ति की प्रणालीगत विषमता उत्पन्न करेगा, और एक जो भविष्यवक्ति की व्युत्क्रम मात्रा बढ़ाए बिना विषमता उत्पन्न करेगा। इन दो प्रभावों के बीच ज्यामितीय अंतर को समझाइए।