1930 के दशक में, जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न गणित की एक नई और दिलचस्प शाखा के संस्थापक बने, जिसे "गेम थ्योरी" कहा जाता है। 1950 के दशक में, युवा गणितज्ञ जॉन नैश इस दिशा में रुचि रखने लगे। संतुलन का सिद्धांत उनके शोध प्रबंध का विषय बन गया, जिसे उन्होंने 21 वर्ष की आयु में लिखा था। इस प्रकार "नैश इक्विलिब्रियम" नामक एक नई खेल रणनीति का जन्म हुआ, जिसने कई वर्षों बाद - 1994 में नोबेल पुरस्कार जीता।
निबंध लिखने और सामान्य मान्यता के बीच का लंबा अंतराल गणितज्ञ के लिए एक परीक्षा बन गया है। बिना पहचान के प्रतिभा के कारण गंभीर मानसिक विकार हो गए, लेकिन जॉन नैश अपने उत्कृष्ट तार्किक दिमाग की बदौलत इस समस्या को हल करने में सक्षम थे। उनके नैश इक्विलिब्रियम सिद्धांत ने नोबेल पुरस्कार जीता और उनके जीवन को सुंदर दिमाग में फिल्माया गया।
गेम थ्योरी के बारे में संक्षेप में
चूंकि नैश संतुलन सिद्धांत बातचीत की स्थितियों में लोगों के व्यवहार की व्याख्या करता है, यह गेम थ्योरी की बुनियादी अवधारणाओं पर विचार करने योग्य है।
गेम थ्योरी प्रतिभागियों (एजेंटों) के व्यवहार का एक खेल की तरह एक दूसरे के साथ बातचीत के संदर्भ में अध्ययन करती है, जब परिणाम कई लोगों के निर्णय और व्यवहार पर निर्भर करता है।प्रतिभागी दूसरों के व्यवहार के बारे में अपनी भविष्यवाणियों के आधार पर निर्णय लेता है, जिसे खेल रणनीति कहा जाता है।
एक प्रमुख रणनीति भी है जिसमें प्रतिभागी को अन्य प्रतिभागियों के किसी भी व्यवहार के लिए सबसे अच्छा परिणाम मिलता है। यह खिलाड़ी की सर्वश्रेष्ठ जीत-जीत की रणनीति है।
कैदी की दुविधा और वैज्ञानिक सफलता
कैदी की दुविधा एक ऐसे खेल का मामला है जहां प्रतिभागियों को विकल्पों के टकराव की स्थिति में एक सामान्य लक्ष्य प्राप्त करने के लिए तर्कसंगत निर्णय लेने के लिए मजबूर किया जाता है। सवाल यह है कि वह इनमें से कौन सा विकल्प चुनेंगे, व्यक्तिगत और सामान्य रुचि को महसूस करते हुए, साथ ही दोनों को प्राप्त करने की असंभवता। ऐसा लगता है कि खिलाड़ी कठिन खेल के माहौल में कैद हैं, जो कभी-कभी उन्हें बहुत उत्पादक रूप से सोचने पर मजबूर कर देता है।
इस दुविधा की खोज अमेरिकी गणितज्ञ जॉन नैश ने की थी। उन्होंने जो संतुलन बनाया वह अपने तरीके से क्रांतिकारी था। विशेष रूप से उज्ज्वल इस नए विचार ने अर्थशास्त्रियों की राय को प्रभावित किया कि कैसे बाजार के खिलाड़ी दूसरों के हितों को ध्यान में रखते हुए, करीबी बातचीत और हितों के प्रतिच्छेदन के साथ चुनाव करते हैं।
ठोस उदाहरणों के माध्यम से गेम थ्योरी का अध्ययन करना सबसे अच्छा है, क्योंकि यह गणितीय अनुशासन अपने आप में शुष्क सैद्धांतिक नहीं है।
कैदी की दुविधा का उदाहरण
उदाहरण, दो लोगों ने डकैती की, पुलिस के हाथों गिरे और अलग-अलग सेल में पूछताछ की जा रही है. उसी समय, पुलिस अधिकारी प्रत्येक प्रतिभागी को अनुकूल परिस्थितियों की पेशकश करते हैं जिसके तहत यदि वह अपने साथी के खिलाफ गवाही देता है तो उसे रिहा कर दिया जाएगा। की प्रत्येकअपराधियों के पास निम्नलिखित रणनीतियाँ हैं जिन पर वह विचार करेगा:
- दोनों एक ही समय में गवाही देते हैं और 2.5 साल की जेल पाते हैं।
- दोनों एक ही समय में चुप रहते हैं और प्रत्येक को 1 वर्ष मिलता है, क्योंकि इस मामले में उनके अपराध का साक्ष्य आधार छोटा होगा।
- एक गवाही देता है और रिहा हो जाता है, जबकि दूसरा चुप रहता है और 5 साल जेल की सजा पाता है।
जाहिर है, मामले का परिणाम दोनों प्रतिभागियों के निर्णय पर निर्भर करता है, लेकिन वे सहमत नहीं हो सकते, क्योंकि वे अलग-अलग कक्षों में बैठे हैं। एक सामान्य हित के संघर्ष में उनके व्यक्तिगत हितों का टकराव भी स्पष्ट रूप से दिखाई देता है। प्रत्येक कैदी के पास कार्रवाई के लिए दो विकल्प और परिणामों के लिए 4 विकल्प हैं।
तार्किक अनुमानों की श्रृंखला
तो, अपराधी ए निम्नलिखित विकल्पों पर विचार कर रहा है:
- मैं खामोश हूँ और मेरा साथी खामोश है - हम दोनों को 1 साल की जेल होगी।
- मैं अपने साथी में बदल जाता हूं और वह मुझे अंदर कर देता है - हम दोनों को 2.5 साल की जेल होती है।
- मैं चुप हूं, और मेरे साथी ने मुझे धोखा दिया - मुझे 5 साल की जेल होगी, और वह मुक्त हो जाएगा।
- मैं अपने साथी को सौंपता हूं, लेकिन वह चुप है - मुझे आजादी मिलती है, और उसे 5 साल की जेल होती है।
स्पष्टता के लिए संभावित समाधानों और परिणामों का एक मैट्रिक्स दें।
कैदी की दुविधा के संभावित परिणामों की तालिका।
सवाल यह है कि प्रत्येक प्रतियोगी क्या चुनेगा?
"चुप रहो, तुम बोल नहीं सकते" या "तुम चुप नहीं रह सकते, तुम बोल नहीं सकते"
प्रतिभागी की पसंद को समझने के लिए आपको उसके विचारों की श्रृंखला से गुजरना होगा। आपराधिक ए के तर्क के बाद: यदि मैं चुप रहता हूं और मेरा साथी चुप रहता है, तो हमें न्यूनतम अवधि (1 वर्ष) प्राप्त होगी, लेकिन मैंमुझे नहीं पता कि वह कैसा व्यवहार करेगा। अगर वह मेरे खिलाफ गवाही देता है, तो मेरे लिए गवाही देना बेहतर है, नहीं तो मैं 5 साल तक बैठ सकता हूं। मैं 5 साल के बजाय 2.5 साल बैठना पसंद करूंगा। अगर वह चुप रहता है, तो मुझे और अधिक गवाही देने की आवश्यकता है, क्योंकि इस तरह मुझे अपनी स्वतंत्रता मिल जाएगी। प्रतिभागी बी.
यह देखना मुश्किल नहीं है कि प्रत्येक अपराधी के लिए प्रमुख रणनीति गवाही देना है। इस खेल का इष्टतम बिंदु तब आता है जब दोनों अपराधी गवाही देते हैं और अपना "पुरस्कार" प्राप्त करते हैं - 2.5 साल की जेल। नैश गेम थ्योरी इस संतुलन को कहते हैं।
गैर इष्टतम इष्टतम नैश समाधान
नाशियन दृष्टिकोण की क्रांतिकारी प्रकृति यह है कि व्यक्तिगत भागीदार और उसके स्वार्थ पर विचार करते समय ऐसा संतुलन इष्टतम नहीं है। आखिर सबसे अच्छा विकल्प है चुप रहना और मुक्त हो जाना।
नैश संतुलन हितों के अभिसरण का एक बिंदु है, जहां प्रत्येक प्रतिभागी उस विकल्प को चुनता है जो उसके लिए इष्टतम है, यदि अन्य प्रतिभागी एक निश्चित रणनीति चुनते हैं।
विकल्प पर विचार करते हुए जब दोनों अपराधी चुप हैं और केवल 1 वर्ष प्राप्त करते हैं, हम इसे पारेतो-इष्टतम विकल्प कह सकते हैं। हालांकि, यह तभी संभव है जब अपराधी पहले से सहमत हों। लेकिन यह भी इस परिणाम की गारंटी नहीं देगा, क्योंकि समझौते से पीछे हटने और सजा से बचने का प्रलोभन महान है। एक-दूसरे पर पूर्ण विश्वास की कमी और 5 साल होने का खतरा मान्यता के साथ विकल्प चुनने को मजबूर करता है। इस पर चिंतन करें कि प्रतिभागी किसका पालन करेंगेमौन के साथ विकल्प, संगीत कार्यक्रम में अभिनय, बस तर्कहीन है। यदि हम नैश संतुलन का अध्ययन करें तो ऐसा निष्कर्ष निकाला जा सकता है। उदाहरण ही आपको सही साबित करते हैं।
स्वार्थी या तर्कसंगत
नैश इक्विलिब्रियम थ्योरी ने चौंकाने वाले निष्कर्ष निकाले जो पहले मौजूद सिद्धांतों को खारिज कर देते थे। उदाहरण के लिए, एडम स्मिथ ने प्रत्येक प्रतिभागी के व्यवहार को पूरी तरह से स्वार्थी माना, जिसने व्यवस्था को संतुलन में ला दिया। इस सिद्धांत को "बाजार का अदृश्य हाथ" कहा जाता था।
जॉन नैश ने देखा कि यदि सभी प्रतिभागी अपने हित में कार्य करते हैं, तो यह कभी भी एक इष्टतम समूह परिणाम की ओर नहीं ले जाएगा। यह देखते हुए कि तर्कसंगत सोच प्रत्येक प्रतिभागी में निहित है, नैश संतुलन रणनीति द्वारा प्रस्तावित विकल्प की अधिक संभावना है।
विशुद्ध रूप से पुरुष प्रयोग
एक प्रमुख उदाहरण गोरा विरोधाभास खेल है, जो प्रतीत होता है कि जगह से बाहर है, यह एक स्पष्ट उदाहरण है कि नैश गेम थ्योरी कैसे काम करती है।
इस गेम में आपको यह कल्पना करने की आवश्यकता है कि मुक्त लोगों की एक कंपनी एक बार में आई। पास में लड़कियों की एक कंपनी है, जिनमें से एक दूसरों के लिए बेहतर है, एक गोरा कहते हैं। लड़के अपने लिए सबसे अच्छी प्रेमिका पाने के लिए कैसे कार्य करते हैं?
तो, लड़कों का तर्क: अगर हर कोई गोरे से परिचित होना शुरू कर देता है, तो, सबसे अधिक संभावना है, किसी को नहीं मिलेगा, तो उसके दोस्त परिचित नहीं होना चाहेंगे। कोई दूसरा फॉलबैक नहीं बनना चाहता। लेकिन अगर लड़के बचना चुनते हैंगोरा है, तो लड़कियों में से प्रत्येक लड़के के लिए एक अच्छी प्रेमिका खोजने की संभावना अधिक होती है।
नैश संतुलन की स्थिति लोगों के लिए इष्टतम नहीं है, क्योंकि, केवल अपने स्वार्थों का पीछा करते हुए, हर कोई गोरा को चुनेगा। यह देखा जा सकता है कि केवल स्वार्थी हितों की खोज समूह हितों के पतन के समान होगी। नैश संतुलन का मतलब होगा कि प्रत्येक व्यक्ति अपने हितों में कार्य करता है, जो पूरे समूह के हितों के संपर्क में है। सफलता के लिए समग्र रणनीति के आधार पर यह व्यक्तिगत रूप से सभी के लिए सबसे अच्छा विकल्प नहीं है, बल्कि सभी के लिए सबसे अच्छा विकल्प है।
हमारा पूरा जीवन एक खेल है
वास्तविक दुनिया में निर्णय लेना एक खेल की तरह है जहां आप अन्य प्रतिभागियों से भी कुछ तर्कसंगत व्यवहार की अपेक्षा करते हैं। व्यापार में, काम पर, एक टीम में, एक कंपनी में, और यहाँ तक कि विपरीत लिंग के साथ संबंधों में भी। बड़े सौदों से लेकर सामान्य जीवन स्थितियों तक, सब कुछ किसी न किसी कानून का पालन करता है।
बेशक, अपराधियों और एक बार के साथ उपरोक्त खेल स्थितियां केवल उत्कृष्ट उदाहरण हैं जो नैश संतुलन को प्रदर्शित करते हैं। वास्तविक बाजार में ऐसी दुविधाओं के उदाहरण अक्सर सामने आते हैं, और यह विशेष रूप से उन मामलों में काम करता है जहां दो एकाधिकारवादी बाजार को नियंत्रित करते हैं।
मिश्रित रणनीतियाँ
अक्सर हम एक नहीं बल्कि कई खेलों में एक साथ शामिल होते हैं। एक खेल में विकल्पों में से एक को चुनना, एक तर्कसंगत रणनीति द्वारा निर्देशित, लेकिन आप दूसरे गेम में समाप्त होते हैं। कुछ तर्कसंगत निर्णयों के बाद, आप पा सकते हैं कि आपका परिणाम आपकी पसंद के अनुसार नहीं है। क्यालो?
आइए दो प्रकार की रणनीति पर विचार करें:
- शुद्ध रणनीति प्रतिभागी का व्यवहार है, जो अन्य प्रतिभागियों के संभावित व्यवहार के बारे में सोचने से आता है।
- मिश्रित रणनीति या यादृच्छिक रणनीति यादृच्छिक रूप से शुद्ध रणनीतियों का विकल्प है या एक निश्चित संभावना के साथ एक शुद्ध रणनीति का चुनाव है। इस रणनीति को यादृच्छिक भी कहा जाता है।
इस व्यवहार को ध्यान में रखते हुए, हमें नैश संतुलन पर एक नया रूप मिलता है। यदि पहले यह कहा जाता था कि खिलाड़ी एक बार रणनीति चुनता है, तो दूसरे व्यवहार की कल्पना की जा सकती है। यह माना जा सकता है कि खिलाड़ी एक निश्चित संभावना के साथ यादृच्छिक रूप से एक रणनीति चुनते हैं। खेल जो नैश संतुलन को शुद्ध रणनीतियों में नहीं ढूंढ सकते हैं, वे हमेशा मिश्रित रणनीतियों में होते हैं।
मिश्रित रणनीतियों में नैश संतुलन को मिश्रित संतुलन कहा जाता है। यह एक संतुलन है जहां प्रत्येक प्रतिभागी अपनी रणनीतियों को चुनने की इष्टतम आवृत्ति चुनता है, बशर्ते कि अन्य प्रतिभागी एक निश्चित आवृत्ति के साथ अपनी रणनीतियों का चयन करें।
जुर्माना और मिली-जुली रणनीति
मिश्रित रणनीति का उदाहरण फुटबॉल के खेल में देखने को मिलता है। मिश्रित रणनीति का सबसे अच्छा उदाहरण शायद पेनल्टी शूटआउट है। तो, हमारे पास एक गोलकीपर है जो केवल एक कोने में कूद सकता है, और एक खिलाड़ी जो पेनल्टी लेगा।
तो, अगर पहली बार खिलाड़ी बाएं कोने में शूट करने की रणनीति चुनता है, और गोलकीपर भी इस कोने में गिर जाता है और गेंद को पकड़ लेता है, तो दूसरी बार चीजें कैसे विकसित हो सकती हैं? अगर खिलाड़ीविपरीत कोने में मारा जाएगा, यह सबसे अधिक स्पष्ट है, लेकिन एक ही कोने में मारना कम स्पष्ट नहीं है। इसलिए, गोलकीपर और किकर दोनों के पास यादृच्छिक चयन पर भरोसा करने के अलावा कोई विकल्प नहीं है।
इस प्रकार, एक निश्चित शुद्ध रणनीति के साथ यादृच्छिक चयन को वैकल्पिक करके, खिलाड़ी और गोलकीपर अधिकतम परिणाम प्राप्त करने का प्रयास करते हैं।