back to top
Tuesday, February 11, 2025
HomeराजनीतिPolls get elections wrong. So use Google, says Seth Stephens-Davidowitz

Polls get elections wrong. So use Google, says Seth Stephens-Davidowitz

पिछले 90 वर्षों से, चुनाव पूर्वानुमानकर्ताओं के टूलबॉक्स में एक उपकरण रहा है: सर्वेक्षण। लगातार तीसरे अमेरिकी राष्ट्रपति चुनाव के बाद, जिसमें इस पद्धति ने डोनाल्ड ट्रम्प के लिए समर्थन को कम करके आंका, इस पर संदेह करने के कई कारण हैं कि यह अब और भी सार्थक होगा। लोगों के एक छोटे से नमूने को बुलाना और उनसे पूछना कि वे क्या करने जा रहे हैं, ऐसी दुनिया में कालानुक्रमिक लगता है जिसमें तकनीकी दिग्गज उपभोक्ता कार्यों की भविष्यवाणी करने के लिए अरबों ऑनलाइन डेटा बिंदुओं का खनन करते हैं – ऐसे दिग्गज जो अक्सर उपभोक्ताओं को खुद से बेहतर जानते हैं।

मतदान से जुड़ी समस्याओं पर विचार करें. पहले तो लोग उन्हें जवाब नहीं देते. सर्वेक्षण प्रतिक्रिया दर गिरकर 2% से भी कम हो गई है।

दूसरा, लोग उनके साथ खिलवाड़ करते हैं। युवा लोगों को विशेष रूप से ग़लत उत्तर देने में आनंद आने की संभावना है। एक अकादमिक अध्ययन में सर्वेक्षण डेटा में अपनाए जाने और विभिन्न समस्याग्रस्त व्यवहारों के बीच संबंध पाया गया; जब यह पाया गया कि जिन लोगों ने कहा था कि उन्हें गोद लिया गया है, उनमें से 19% सिर्फ मजाक कर रहे थे, तो अध्ययन वापस ले लिया गया।

तीसरा, लोग अपनी आत्म-छवि की रक्षा के लिए प्रदूषकों से झूठ बोलते हैं, जिसे सामाजिक-वांछनीयता पूर्वाग्रह कहा जाता है। धोखे का स्तर चौंकाने वाला हो सकता है. शोध से पता चलता है कि चुनाव में वोट नहीं देने वाले दस में से लगभग चार लोग सर्वेक्षण में रिपोर्ट करेंगे जो उन्होंने किया था। लोगों को नाटकीय रूप से यह बताने के लिए भी जाना जाता है कि वे कितना सेक्स करते हैं, दान देने की उनकी प्रवृत्ति और उनकी शैक्षणिक उपलब्धियाँ क्या हैं।

इन गैर-उत्तरदाताओं, चालबाजों और झूठों ने संभवतः श्री ट्रम्प के उम्मीद से बेहतर प्रदर्शन में भूमिका निभाई। ऐसे कुछ सबूत हैं जो बताते हैं कि उनके समर्थकों द्वारा सर्वेक्षणों का जवाब देने की संभावना कम है, उनके साथ खिलवाड़ करने की संभावना अधिक है और उनमें यह स्वीकार करने की संभावना कम है कि वे उनका समर्थन करते हैं।

क्या इससे यह अनुमान लगाने के लिए सर्वेक्षण बेकार हो जाते हैं कि चुनाव में क्या होगा? पूरी तरह से नहीं. भले ही वे शोरगुल वाले और त्रुटिपूर्ण हों, सर्वेक्षणों में कुछ उपयोगी जानकारी होती है, विशेष रूप से हमें यह समझने में मदद करने के लिए कि उम्मीदवारों के लिए समर्थन कहाँ बदल सकता है। मैंने श्री ट्रम्प के वास्तविक प्रदर्शन की तुलना पोल एग्रीगेटर फाइव थर्टीएट द्वारा की गई भविष्यवाणी से की। 2020 और 2024 के बीच श्री ट्रम्प के समर्थन में राज्य-स्तर पर लगभग आधे बदलाव की भविष्यवाणी सर्वेक्षणों द्वारा की जा सकती है। सर्वेक्षणों ने सही ढंग से नोट किया कि केंटुकी, न्यूयॉर्क और मैसाचुसेट्स में उनका वोट शेयर बढ़ने वाला था। और ऐसे रुझान भी हैं जिन्हें आसानी से नज़रअंदाज कर दिया गया। चुनाव के कुछ आश्चर्यजनक पैटर्न, जैसे कि अत्यधिक हिस्पैनिक जिलों में श्री ट्रम्प का मजबूत प्रदर्शन, उन लोगों के लिए कम आश्चर्यजनक रहे होंगे जो उन सर्वेक्षणों पर करीब से ध्यान दे रहे थे जिन्होंने बड़े पैमाने पर उस बदलाव की भविष्यवाणी की थी।

जैसा कि कहा गया है, सर्वेक्षण स्पष्ट रूप से यह भविष्यवाणी करने के लिए संघर्ष करते हैं कि चुनाव में क्या होगा। और, ऐसे युग में जब इंटरनेट पर घूमती मानवता हर दिन 400 टेराबाइट से अधिक डेटा का उत्पादन करती है, कुछ हज़ार लोगों की प्रतिक्रियाओं पर आशा बांधना बहुत अजीब है, जो फोन उठाते हैं, और जो फोन उठा भी सकते हैं या नहीं भी उठा सकते हैं। प्रदूषकों के प्रति या स्वयं के प्रति ईमानदार रहें।

पिछले 15 वर्षों से मैं Google खोजों का अध्ययन कर रहा हूँ। मैंने और अन्य लोगों ने पाया है कि खोज डेटा अक्सर सर्वेक्षणों की तुलना में कहीं अधिक पूर्वानुमानित होते हैं। “वोट” और “वोटिंग” के लिए Google खोज यह अनुमान लगा सकती है कि वास्तव में कौन मतदान करने आएगा, न कि केवल वे जो कहते हैं कि वे मतदान करेंगे – ठीक उसी तरह जैसे आत्महत्या से संबंधित खोजें आत्महत्या के विचारों की सर्वेक्षण रिपोर्टों की तुलना में आत्महत्या दर का बेहतर अनुमान लगा सकती हैं। Google खोजों से पता चला कि अमेरिका में नस्लवाद सबसे अधिक कहाँ था और श्री ट्रम्प के शीघ्र उदय की भविष्यवाणी की गई। और अप्रैल 2020 में मैंने उनका उपयोग कोविड-19 के एक नए लक्षण की खोज के लिए किया: आंखों में दर्द, स्वास्थ्य शोधकर्ताओं द्वारा महीनों बाद इसकी पुष्टि की गई।

पहले से ही कुछ सबूत हैं कि खोज डेटा चुनावों के आसपास समृद्ध पूर्वानुमान शक्ति प्रदान कर सकता है, और जरूरी नहीं कि सीधी पूछताछ करके। उदाहरण के लिए, यूसीएलए के स्टुअर्ट गेब्रियल और मैंने पाया कि कई राष्ट्रपति चक्रों में Google पर उम्मीदवारों को जिस क्रम में खोजा जाता है, वह अपने आप में एक संकेतक है। जो लोग “ट्रम्प हैरिस डिबेट” खोजते हैं, वे “हैरिस ट्रम्प डिबेट” खोजने वाले लोगों की तुलना में श्री ट्रम्प का समर्थन करने की अधिक संभावना रखते हैं। इस सूचक के बारे में सबसे आकर्षक बात यह है कि, फिर से, डेटा कुछ ऐसा प्रकट कर सकता है जिसका खोजकर्ता को एहसास भी नहीं हो सकता है। प्रत्यक्ष रूप से अनिर्णीत मतदाता खोज करते समय सबसे पहले किस उम्मीदवार को शामिल करते हैं, इसके आधार पर वे अपने समर्थन का संकेत दे सकते हैं।

ट्रम्प के गढ़ मिसिसिपी में, दोनों उम्मीदवारों के नाम के साथ 65% से अधिक खोजों में “ट्रम्प” को पहले स्थान पर शामिल किया गया – जो किसी भी राज्य में सबसे अधिक है। हैरिस के गढ़, वर्मोंट में, दोनों उम्मीदवारों के नामों के साथ 58% से अधिक खोजों में “हैरिस” को पहले स्थान पर शामिल किया गया। -किसी भी राज्य में सबसे ज्यादा। कुल मिलाकर, जिन 26 राज्यों में “ट्रम्प” को सबसे पहले शामिल करने की संभावना है, उनमें से 24 राज्यों की दो-नाम वाली Google खोजों में ट्रम्प के लिए गए। जिन 25 राज्यों में “हैरिस” को सबसे पहले शामिल करने की संभावना है, उनमें से उन्नीस हैरिस के लिए गए। और हमने लगातार चार चुनाव देखे हैं जिनमें इस संकेतक को जोड़ने से औसत चुनावों की तुलना में राज्य-स्तरीय भविष्यवाणियों में सुधार होता।

हम अभी भी इस अध्ययन के शुरुआती दौर में हैं कि कैसे ऑनलाइन डेटा मानव व्यवहार को समझने और भविष्यवाणी करने में मदद कर सकता है। लेकिन यह बिल्कुल स्पष्ट है कि 2024 का चुनाव आखिरी चुनावों में से एक होगा जिसमें परिणामों की भविष्यवाणी करने के लिए अकेले सर्वेक्षणों का उपयोग किया जाता है।

सेठ स्टीफ़ेंस-डेविडोवित्ज़ एक डेटा वैज्ञानिक और लेखक हैं जो पहले Google में काम करते थे।

© 2025, द इकोनॉमिस्ट न्यूजपेपर लिमिटेड। सर्वाधिकार सुरक्षित। द इकोनॉमिस्ट से, लाइसेंस के तहत प्रकाशित। मूल सामग्री www.economist.com पर पाई जा सकती है

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular

Recent Comments