संख्याएँ उतनी वस्तुनिष्ठ क्यों नहीं हैं जितनी हम सोचते हैं
अनेक वस्तुओं का संग्रह / / July 29, 2022
वास्तव में, उन्हें हेरफेर करना आसान है।
आंकड़ों, तालिकाओं, रेखांकन और वैज्ञानिक शब्दों द्वारा समर्थित होने पर किसी भी संदिग्ध कथन को सत्य माना जा सकता है। इस तरह की चालों में न पड़ने के लिए, बकवास को पहचानने में सक्षम होना और आम तौर पर यह समझना महत्वपूर्ण है कि यह क्या है। MIF पब्लिशिंग हाउस की एक नई किताब "पूर्ण बकवास!" इसमें मदद करेगा। यह विकासवादी जीवविज्ञानी प्रोफेसर कार्ल बर्गस्ट्रॉम और यूनिवर्सिटी ऑफ वाशिंगटन स्कूल ऑफ इंफॉर्मेशन, जेविन वेस्ट में सहायक प्रोफेसर द्वारा लिखा गया था। और लाइफहाकर पांचवें अध्याय का एक अंश प्रकाशित करता है।
हमारी दुनिया सचमुच डिजीटल है। सब कुछ गणना, मापा, विश्लेषण और मूल्यांकन किया जाता है। इंटरनेट कंपनियां हमें ऑनलाइन ट्रैक करती हैं और एल्गोरिदम का उपयोग करके भविष्यवाणी करती हैं कि हम क्या खरीदेंगे। स्मार्टफोन हमारे कदमों को गिनते हैं, कॉल की अवधि को मापते हैं और दिन भर हमारी गतिविधियों को ट्रैक करते हैं। स्मार्ट डिवाइस नियंत्रित करते हैं कि हम उनका उपयोग कैसे करते हैं और जितना हम कल्पना कर सकते हैं उससे अधिक हमारे दैनिक दिनचर्या के बारे में जानते हैं। प्रत्यारोपित चिकित्सा उपकरण रोगी की जानकारी की एक सतत धारा को खिलाते हैं और वास्तविक समय में खतरे के संकेतों की निगरानी करते हैं। रखरखाव के दौरान, हमारी कारें उनके प्रदर्शन और हमारी ड्राइविंग शैली के बारे में डेटा अपलोड करती हैं। शहरों में लगाए गए असंख्य सेंसर और कैमरे यातायात प्रवाह से लेकर वायु गुणवत्ता तक हर चीज़ पर नज़र रखते हैं, और यहां तक कि सेटिंग करने में भी सक्षम हैं
राहगीरों के व्यक्तित्व.महंगे सर्वेक्षणों और सर्वेक्षणों के माध्यम से उपभोक्ता व्यवहार के बारे में डेटा एकत्र करने के बजाय, कंपनियां लोगों को अपने आप उनके पास आने देती हैं और फिर वे जो कुछ भी करती हैं उसे रिकॉर्ड करती हैं। फेसबुक* जानता है कि हम किसे जानते हैं। Google - हम क्या जानना चाहते हैं। उबेर - जहां हम जाने का इरादा रखते हैं। Amazon - हम क्या खरीदना चाहते हैं। मैच - जिनके साथ हम एक पारिवारिक संघ बनाने की योजना बना रहे हैं। tinder - जिनसे हम संवाद करने के निमंत्रण की प्रतीक्षा कर रहे हैं।
डेटा हमें वस्तुनिष्ठ तथ्यों के संदर्भ में दुनिया को समझने में मदद कर सकता है, लेकिन डेटा कहीं भी उद्देश्य के करीब नहीं है जैसा कि हम सोचते हैं। यहां एक पुराना जोक दिमाग में आता है। एक गणितज्ञ, एक इंजीनियर और एक एकाउंटेंट को नौकरी मिलती है। उन्हें एक कार्यालय में ले जाया जाता है और गणित की परीक्षा दी जाती है। वार्म अप के लिए पहला काम: टू प्लस टू कितना होता है? गणितज्ञ अपनी आँखें घुमाता है, "चार" लिखता है और अगले कार्यों के लिए आगे बढ़ता है। इंजीनियर एक सेकंड के लिए सोचता है, फिर "लगभग चार" लिखता है। लेखाकार उत्सुकता से चारों ओर देखता है, फिर अपनी कुर्सी से उठता है, उस व्यक्ति के पास जाता है जो परीक्षण करता है, और दबी आवाज़ में पूछता है: “इससे पहले कि मैं कुछ भी लिखूँ, मुझे बताओ कि तुम क्या चाहते हो प्राप्त?"
नंबर बकवास बात करने के लिए एकदम सही हैं। वे वस्तुनिष्ठ लगते हैं लेकिन सही कहानी बताने के लिए आसानी से हेरफेर किया जा सकता है।
शब्द निश्चित रूप से मानव मन द्वारा निर्मित होते हैं, लेकिन संख्याओं का क्या? संख्या हमें प्रकृति द्वारा ही दी गई लगती है। हम जानते हैं कि शब्द व्यक्तिपरक हैं। हम जानते हैं कि उनका उपयोग सच्चाई को मोड़ने और विकृत करने के लिए किया जाता है। शब्द अंतर्ज्ञान, भावनाओं, जुनून को दर्शाते हैं। संख्याएँ उस व्यक्ति से अलग होती हैं जो उनके बारे में बात करता है।
संख्या में लोगों का विश्वास अविश्वसनीय रूप से मजबूत है। संशयवादियों का दावा है कि वे "केवल डेटा देखना चाहते हैं" या "बेसलाइन डेटा" दिखाने की मांग करते हैं या जोर देते हैं कि "संख्याओं को अपने लिए बोलना चाहिए।" हम आश्वस्त हैं कि "डेटा कभी नहीं" लेट जाना». लेकिन यह नजारा खतरनाक हो सकता है। भले ही मान या संख्याएं सही हों, फिर भी उनका उपयोग सिर को मूर्ख बनाने के लिए किया जा सकता है [...] संख्याओं को समझने योग्य होने के लिए, उन्हें एक उपयुक्त संदर्भ में होना चाहिए। उन्हें इस तरह प्रदर्शित करने की आवश्यकता है कि एक ईमानदार तुलना हमारे लिए उपलब्ध हो।
आइए पहले सोचें कि ये नंबर कहां से आते हैं। उनमें से कुछ हम सटीक गिनती या माप से सीधे प्राप्त करते हैं। संयुक्त राज्य अमेरिका में 50 राज्य हैं। 100 से कम 25 अभाज्य संख्याएँ हैं। एम्पायर स्टेट बिल्डिंग में 102 मंजिल हैं। बेसबॉल के दिग्गज टोनी Gwin ने .388 के मेजर लीग बल्लेबाजी औसत के लिए बल्लेबाजी में 9,288 में से 3,141 हिट लगाए। सिद्धांत रूप में, एक सटीक गणना काफी सीधे आगे होनी चाहिए। एक निश्चित उत्तर है, और आमतौर पर एक निश्चित गणना या माप प्रक्रिया होती है जिसका उपयोग उस तक पहुंचने के लिए किया जा सकता है। लेकिन यह प्रक्रिया हमेशा आसान नहीं होती है। गणना, माप, या वास्तव में हम क्या मानते हैं, में गलतियाँ करना काफी संभव है। उदाहरण के लिए ग्रहों को लें। सौर प्रणाली. 1846 में नेपच्यून की खोज के समय से लेकर 1930 में प्लूटो की खोज तक, हमने सोचा कि सौर मंडल में आठ ग्रह हैं। प्लूटो की खोज के बाद हमने कहा कि हमारे पास नौ ग्रह हैं। फिर, 2006 में, दुर्भाग्यपूर्ण "नवागंतुक" को एक बौने ग्रह की स्थिति में पदावनत कर दिया गया था, और आठ पूर्ण ग्रह फिर से सूर्य की परिक्रमा कर रहे थे।
हालांकि, अक्सर, सटीक गणना या संपूर्ण माप संभव नहीं होते हैं।
हम प्रेक्षित में प्रत्येक तारे को अलग से गिनने में सक्षम नहीं हैं ब्रह्मांडवर्तमान ट्रिलियन ट्रिलियन सन्निकटन पर पहुंचने के लिए।
इसी तरह, हम किसी विशेष देश में एक वयस्क की ऊंचाई जैसे संकेतकों को देखते हुए मोटे अनुमानों पर भरोसा करते हैं। नीदरलैंड के पुरुषों को दुनिया में सबसे लंबा माना जाता है - औसतन 183 सेंटीमीटर। लेकिन इन आंकड़ों को प्राप्त करने के लिए, उन्होंने देश के सभी निवासियों को नहीं मापा और सभी प्राप्त मूल्यों के औसत की गणना नहीं की। इसके बजाय, शोधकर्ताओं ने स्थानीय पुरुषों के एक यादृच्छिक नमूने का उपयोग किया, जो मापा गया कि इसमें कौन गिर गया, और पूरी आबादी के निष्कर्षों को एक्सट्रपलेशन किया।
यदि कोई आधा दर्जन पुरुषों को मापता है और उनकी औसत ऊंचाई की गणना करता है, तो केवल संयोग से परिणाम गलत होगा। मान लीजिए उनमें से कुछ असामान्य रूप से लम्बे थे। इसे कहते हैं नमूनाकरण त्रुटि. सौभाग्य से, एक बड़ा नमूना आमतौर पर भिन्नताओं को भी बाहर कर देगा, ताकि इस तरह की त्रुटि का परिणाम पर न्यूनतम प्रभाव पड़े।
माप प्रक्रिया के साथ समस्याएं भी उत्पन्न हो सकती हैं। मान लीजिए कि शोधकर्ताओं ने प्रतिभागियों से उनकी ऊंचाई की रिपोर्ट करने के लिए कहा, लेकिन पुरुषों की संख्या बढ़ जाती है, छोटे पुरुष लंबे पुरुषों की तुलना में अधिक बार ऐसा करते हैं।
त्रुटि का एक अन्य स्रोत, स्वयं नमूने का पूर्वाग्रह, और भी खतरनाक है। मान लीजिए कि आप लोगों की ऊंचाई निर्धारित करने का निर्णय लेते हैं, स्थानीय बास्केटबॉल कोर्ट गए और खिलाड़ियों को मापना शुरू किया। बास्केटबॉल खिलाड़ीआम तौर पर औसत ऊंचाई से ऊपर होता है, इसलिए आपका नमूना सामान्य आबादी का प्रतिनिधि नहीं होगा और अंत में बहुत अधिक होगा। इस तरह की अधिकांश त्रुटियां इतनी स्पष्ट नहीं हैं। […]
इन उदाहरणों में, हमने मूल्यों की एक सीमा पर लोगों के समूहों को देखा—उदाहरण के लिए, ऊंचाइयों की एक श्रेणी—और फिर उस जानकारी को एक एकल संख्या में एकत्रित किया, जिसे सारांश आँकड़ा कहा जाता है। उदाहरण के लिए, एक लंबे डचमैन का वर्णन करते समय, हम औसत ऊंचाई के बारे में बात कर रहे हैं।
सारांश आँकड़े जानकारी को संक्षेप में प्रस्तुत करने का एक सुविधाजनक तरीका हो सकते हैं, लेकिन यदि यह सही नहीं है, तो आप आसानी से अपने दर्शकों को गुमराह कर सकते हैं।
राजनेता इस तरकीब का इस्तेमाल तब करते हैं जब वे परिचय देने का प्रस्ताव रखते हैं कर कटौती, जो सबसे अमीर 1% नागरिकों के लिए सैकड़ों-हजारों डॉलर की बचत करेगा, लेकिन किसी भी तरह से बाकी सभी के कर के बोझ को कम नहीं करेगा। वे औसत कर कटौती लेते हैं और दावा करते हैं कि उनकी कर योजना परिवारों को सालाना औसतन $ 4,000 बचाएगी। शायद ऐसा हो, लेकिन औसत परिवार—अगर हमारा मतलब आय वितरण के बीच में है—कुछ भी नहीं बचाएगा। हममें से अधिकांश के लिए यह जानना अधिक उपयोगी होगा कि औसत आय वाले परिवार के लिए कटौती क्या होगी। इस मामले में, माध्य इस मूल्य से अधिक कमाने वाले परिवारों के आधे और इस मूल्य से कम कमाने वाले परिवारों के आधे के बीच "औसत" आय है। इस प्रकार, औसत परिवार को कोई कटौती नहीं मिलेगी, क्योंकि यह केवल उच्चतम आय वाले शीर्ष 1% आबादी के लिए उपयोगी है।
कभी-कभी हम उस संकेतक को सीधे नहीं माप सकते जो हमें रूचि देता है। कार्ल हाल ही में यूटा रेगिस्तान में राजमार्ग के एक सीधे और सपाट खंड पर हाईवे पेट्रोल के रडार के नीचे आया था, जहां किसी अकथनीय कारण के लिए पचास मील प्रति घंटे की गति सीमा निर्धारित की गई थी। वह पीछे के शीशे में लाल और नीली बत्तियों की परिचित चमक को देखते हुए सड़क के किनारे पर आ गया। "क्या आप जानते हैं कि आप कितनी तेजी से गाड़ी चला रहे थे?" पूछा पहरा. "मुझे ऐसा नहीं लगता, अधिकारी," कार्ल ने उत्तर दिया। "अस्सी-तीन मील प्रति घंटा।"
अस्सी-तीन एक गंभीर संख्या है, संभावित रूप से बड़ी मुसीबत की धमकी दे रही है। लेकिन यह आया कहां से? कुछ ट्रैफ़िक कैमरे एक निश्चित समय में आपके द्वारा तय की गई दूरी को मापकर आपकी गति की गणना करते हैं, लेकिन राज्य के राजमार्ग इसे अलग तरह से करते हैं। सैनिक कुछ और माप रहा था—डॉपलर अपने पोर्टेबल रडार द्वारा उत्सर्जित रेडियो तरंगों में बदलाव कर रहा था क्योंकि वे कार्ल की तेज रफ्तार कार से टकरा गए थे। राडार में एम्बेडेड सॉफ्टवेयर तरंग यांत्रिकी पर आधारित एक गणितीय मॉडल का उपयोग करता है जो वाहन को प्राप्त होने वाले मापों का उपयोग करके गति की गणना करता है। चूंकि पैट्रोलमैन सीधे माप नहीं करता है रफ़्तार कार्ला, रडार को नियमित रूप से कैलिब्रेट करने की आवश्यकता है। तेजी से टिकट से छुटकारा पाने का मानक तरीका यह है कि अधिकारी को समय पर अंशांकन रिकॉर्ड दिखाने की आवश्यकता होती है। सच है, कार्ल को इसकी आवश्यकता नहीं थी। वह जानता था कि उसने गति सीमा पार कर ली है, और वह खुश था कि अपनी जल्दबाजी के लिए वह केवल एक जुर्माना के साथ छूट गया, हालांकि एक बड़ा जुर्माना।
रडार बहुत मजबूत भौतिक सिद्धांतों पर भरोसा करते हैं, लेकिन अन्य मेट्रिक्स की गणना करने के लिए उपयोग किए जाने वाले मॉडल अधिक जटिल हो सकते हैं और इसमें अधिक धारणाएं शामिल हो सकती हैं। अंतर्राष्ट्रीय व्हेलिंग आयोग व्हेल की कुछ प्रजातियों की आबादी की संख्या पर डेटा प्रकाशित करता है। जब वह रिपोर्ट करती है कि दक्षिणी गोलार्ध के पानी में 2,300 ब्लू व्हेल हैं, तो वह इस संख्या पर पहुंचती है, इसलिए नहीं कि हर एक को ढूंढा और गिना गया है। जानवर. और उन्होंने समुद्र के किसी भाग से कंघी नहीं की है। व्हेल स्थिर नहीं रहती हैं, और अधिकांश समय वे पानी की सतह से दिखाई नहीं देती हैं। इसलिए, वैज्ञानिकों को जनसंख्या के आकार को निर्धारित करने के लिए अप्रत्यक्ष तरीकों की आवश्यकता है। उदाहरण के लिए, वे अद्वितीय व्यक्तियों के साथ मुठभेड़ों की गणना करते हैं जिन्हें उनके दुम के पंख और पूंछ पर चिह्नों द्वारा पहचाना जा सकता है। तो व्हेल संख्या का उनका निर्धारण उतना ही गलत है जितना कि यह तकनीक है।
गणनाओं और तथ्यों में जो पूरी तरह से स्पष्ट प्रतीत होते हैं, विभिन्न कारणों से त्रुटियां रेंगती हैं। आप संख्याओं से भ्रमित हो सकते हैं। आप बहुत छोटे नमूने का उपयोग कर सकते हैं, जो पूरे समूह की विशेषताओं को गलत तरीके से दर्शाता है। जिन विधियों से हम अन्य सूचनाओं से संख्याएँ प्राप्त करते हैं, वे गलत हो सकती हैं। और अंत में, संख्या पूरी तरह से बकवास हो सकती है, देने के प्रयास में खरोंच से आविष्कार किया गया विद्या दयनीय तर्क। हमें इसे ध्यान में रखना चाहिए जब हमें संख्याओं द्वारा कुछ दिखाया जा रहा हो। ऐसा कहा जाता है कि अंक कभी झूठ नहीं बोलते, लेकिन यह याद रखना चाहिए कि वे अक्सर भ्रामक होते हैं।
"पूरी बकवास!" इस बारे में बात करता है कि गलत सूचना कैसे फैलती है, हम इस पर विश्वास क्यों करते हैं और कैसे सीखें कि कैसे कारण संबंधों का सही आकलन किया जाए। यह पुस्तक साबित करती है कि आपको आंकड़ों के विशेषज्ञ होने की आवश्यकता नहीं है नकली को पहचानें और बदलती अवधारणाएँ। पर्याप्त तर्क और आलोचनात्मक सोच।
कोई किताब खरीदें
यह भी पढ़ें🧐
- धारणा के जाल: कैसे इंद्रियां वास्तविकता को विकृत करती हैं
- क्या इतिहास खुद को दोहरा रहा है? क्या अतीत और वर्तमान की घटनाओं के बीच समानताएं बनाना संभव है?
- पुष्टिकरण पूर्वाग्रह: हम कभी उद्देश्य क्यों नहीं रखते?
- वस्तुनिष्ठ वास्तविकता क्यों मौजूद नहीं है
- हम आँकड़ों से ज्यादा अनुमानों और अफवाहों पर विश्वास क्यों करते हैं
*मेटा प्लेटफॉर्म्स इंक. गतिविधियां। और इसके सोशल नेटवर्क फेसबुक और इंस्टाग्राम रूसी संघ के क्षेत्र में प्रतिबंधित हैं।