पाठ्यक्रम "डेटा विश्लेषक" - पाठ्यक्रम 96,000 रूबल। यांडेक्स वर्कशॉप से, प्रशिक्षण 7 माह, दिनांक 7 दिसंबर, 2023।
अनेक वस्तुओं का संग्रह / / December 02, 2023
एक डेटा विश्लेषक संख्याओं और मूल्यों से अर्थ निकालता है: वह रुझान देखता है, घटनाओं की भविष्यवाणी करता है और कंपनी को ग्राहकों को समझने, प्रक्रियाओं को अनुकूलित करने और बढ़ने में मदद करता है।
बाज़ार को ऐसे विशेषज्ञों की ज़रूरत है जो डेटा का उपयोगी उपयोग कर सकें। सितंबर 2022 के लिए कार्मिक कंपनी एंकोर के एक अध्ययन से पता चला है कि 45% रूसी कंपनियां अपनी टीम में शामिल होने के लिए विश्लेषकों की तलाश कर रही हैं।
कौशल आप पाठ्यक्रम में सीखेंगे
नौकरी का नाम
विश्लेषक, डेटा विश्लेषक, डेटा विश्लेषक
विकास के अवसर: उत्पाद विश्लेषक, विपणन विश्लेषक, बीआई विश्लेषक, डेटा विज्ञान विशेषज्ञ
यहां वे प्रौद्योगिकियां और उपकरण हैं जिनका आप उपयोग करेंगे:
अजगर
ज्यूपिटर नोटबुक
एसक्यूएल
पोस्टग्रेएसक्यूएल
चित्रमय तसवीर
ए/बी परीक्षण
विश्लेषण करके पैसा कमाना शुरू करें
आप जूनियर पद से शुरुआत करेंगे और उसके बाद ही आगे बढ़ेंगे। आप करियर की सीढ़ी चढ़ेंगे और मूल्य में वृद्धि करेंगे। और एक दिन आपके लिए कोई कीमत नहीं होगी.
संपूर्ण डेटा एनालिटिक्स पाठ्यक्रम कार्यक्रम
हम इसे नियमित रूप से अपडेट करते हैं ताकि यह सुनिश्चित हो सके कि यह उद्योग और नियोक्ता की जरूरतों को पूरा करता है।
दूसरे शब्दों में, आप वही सीखते हैं जो निश्चित रूप से आपके काम में उपयोगी होगा।
निःशुल्क भाग - 1 सप्ताह
नि:शुल्क परिचय: पायथन और डेटा विश्लेषण की मूल बातें
डेटा विश्लेषण की बुनियादी अवधारणाओं को जानें और समझें कि डेटा विश्लेषक और डेटा वैज्ञानिक क्या करते हैं।
• मॉस्को कैटनामाइक्स। स्क्रीन पर डेटा प्रदर्शित करना. सीएसवी फ़ाइलें। तालिकाओं के साथ कार्य करना. ताप मानचित्र. किसी स्तंभ को पूर्णांक से गुणा करना.
• कोड में त्रुटियाँ. सिंटैक्स त्रुटियाँ. नामकरण संबंधी त्रुटियाँ. शून्य से विभाजित करते समय त्रुटियाँ. मॉड्यूल आयात करते समय त्रुटियाँ।
• चर और डेटा प्रकार। चर। डेटा के प्रकार। संख्याओं और तारों के साथ अंकगणितीय संक्रियाएँ।
• परिकल्पना कैसे बनायें। परिकल्पनाएँ। हादी चक्र. विश्लेषणात्मक सोच। ग्राफ़ पढ़ना.
• डेटा वैज्ञानिक क्या करते हैं. विश्लेषक कार्य. कार्यों का स्पष्टीकरण. विघटन. परियोजना चरण.
• रूपांतरणों की जाँच करना। रूपांतरण. डेटा अन्वेषण. निष्कर्ष का निर्माण.
• विज्ञापन अभियानों का भुगतान। स्तंभ रेखा - चित्र। तत्वों का अंतर. स्तंभों में अनुक्रमण.
• मशीन लर्निंग और डेटा साइंस। मशीन लर्निंग में प्रशिक्षण. स्तंभों में अद्वितीय मान ढूँढना। तार्किक अनुक्रमण. मानों को एक तालिका में समूहीकृत करना। भविष्यवाणी त्रुटियाँ.
• अंतिम परियोजना। उपयोगकर्ता विभाजन.
PythonPandasErrorsSeabornHypothesesConversionVariablesडेटा प्रकारHeatmaps
1 स्प्रिंट 3 सप्ताह
बेसिक पायथन
पायथन प्रोग्रामिंग भाषा और पांडास लाइब्रेरी के बारे में गहराई से जानें।
• चर और डेटा प्रकार। पायथन भाषा. चर। स्क्रीन पर डेटा प्रदर्शित करना. स्क्रीन पर वस्तुओं को प्रदर्शित करना। त्रुटि प्रबंधन, प्रयास करें...ऑपरेटर को छोड़कर। डेटा के प्रकार। डेटा प्रकार रूपांतरण.
• पंक्तियाँ. पंक्तियों में अनुक्रमणिका. लाइन में कटौती. स्ट्रिंग्स पर संचालन. स्ट्रिंग विधियाँ. फ़ॉर्मेटिंग स्ट्रिंग्स, फ़ॉर्मेट() विधि, एफ-स्ट्रिंग्स।
• सूचियाँ. सूचियों में अनुक्रमणिका. स्लाइस की सूची बनाएं. किसी सूची में आइटम जोड़ना. सूची आइटम हटा रहा है. सूचियों का जोड़ और गुणा. • सूचियाँ क्रमबद्ध करना। किसी सूची में आइटम खोजें. एक स्ट्रिंग को स्ट्रिंग्स की सूची में विभाजित करना, स्ट्रिंग्स की एक सूची को एक स्ट्रिंग में संयोजित करना।
• पाश के लिए। चक्र. तत्वों की गणना. तत्व सूचकांकों पर पुनरावृत्ति। लूप का उपयोग करके सूची तत्वों को संसाधित करना: तत्वों का योग और उत्पाद खोजना।
• नेस्टेड सूचियाँ. मूल्यों की गिनती के साथ नेस्टेड सूचियों के माध्यम से लूपिंग। नेस्टेड सूचियों में तत्व जोड़ना। नेस्टेड सूचियों को क्रमबद्ध करना.
• सशर्त ऑपरेटर. घुमाव के दौरान। बूलियन डेटा प्रकार. बूलियन मान. तार्किक अभिव्यक्तियाँ. यौगिक तार्किक अभिव्यक्तियाँ. सशर्त कथन यदि...एलिफ़...अन्यथा। शाखाबद्ध होना। एक सशर्त ऑपरेटर का उपयोग करके सूचियों को फ़िल्टर करना। घुमाव के दौरान।
• कार्य. कार्यों का समनुदेशन. पैरामीटर और तर्क. डिफ़ॉल्ट मान वाले पैरामीटर. स्थितीय और नामित तर्क. किसी फ़ंक्शन से परिणाम लौटाना।
• शब्दकोश. कुंजी और मूल्य. कुंजी द्वारा मान खोजा जा रहा है। शब्दकोश में आइटम जोड़ना. शब्दकोशों की सूची. शब्दकोशों का सुंदर आउटपुट.
• पांडा पुस्तकालय। सीएसवी फ़ाइलें पढ़ना. डेटा ढांचा। डेटाफ़्रेम कंस्ट्रक्टर. डेटाफ़्रेम की पहली और अंतिम पंक्तियों को प्रिंट करना। डेटाफ़्रेम में अनुक्रमण। श्रृंखला स्तंभों पर अनुक्रमण.
• डेटा प्रीप्रोसेसिंग। गीगो सिद्धांत. डेटाफ़्रेम कॉलम का नाम बदलना. लुप्त मानों को संभालना. स्पष्ट और अंतर्निहित डुप्लिकेट को संभालना।
• डेटा विश्लेषण और परिणामों की प्रस्तुति। डेटा समूहीकरण. डेटा क्रमबद्ध करना. वर्णनात्मक सांख्यिकी की मूल बातें।
• ज्यूपिटर नोटबुक - एक सेल में एक नोटबुक। ज्यूपिटर नोटबुक इंटरफ़ेस। ज्यूपिटर नोटबुक शॉर्टकट।
लूप्सपायथनपांडास्ट्रिंग्ससूचियाँफ़ंक्शनशब्दकोशडेटाफ़्रेमवेरिएबल्सडेटाप्रकारसशर्त कथन
परियोजना
शहर और सप्ताह के दिन के अनुसार यांडेक्स म्यूजिक उपयोगकर्ता डेटा की तुलना करें।
2 स्प्रिंट 2 सप्ताह
डेटा प्रीप्रोसेसिंग
आउटलेर्स, चूक और डुप्लिकेट से डेटा साफ़ करना सीखें, साथ ही विभिन्न डेटा प्रारूपों को परिवर्तित करना भी सीखें।
• पास के साथ काम करना। रूपांतरण. कुकीज़। श्रेणीबद्ध और मात्रात्मक चर. श्रेणीगत चरों में अंतराल को संभालना। मात्रात्मक चर में अंतराल को संभालना। श्रेणी के अनुसार मात्रात्मक चर में अंतराल को संभालना।
• डेटा प्रकार बदलना। एक्सेल फ़ाइलें पढ़ना. श्रृंखला को संख्यात्मक प्रकार में बदलें। संख्या मॉड्यूल, एबीएस() विधि। दिनांक और समय के साथ कार्य करना. त्रुटि प्रबंधन, प्रयास करें...ऑपरेटर को छोड़कर। डेटाफ़्रेम को मर्ज करना, मर्ज() विधि। पिवट तालिकाएं।
• डुप्लीकेट खोजें. डुप्लिकेट खोजें, केस संवेदनशील।
• डेटा वर्गीकरण. तालिकाओं का अपघटन. संख्यात्मक श्रेणियों द्वारा वर्गीकरण. प्रति पंक्ति एकाधिक मानों के आधार पर वर्गीकृत करें।
• एक विश्लेषक के काम में व्यवस्थित और आलोचनात्मक सोच। प्रणालियों की सोच। डेटा त्रुटियों के कारण. महत्वपूर्ण सोच।
PythonPandasGap हैंडलिंग डेटा प्रोसेसिंग डुप्लिकेट प्रोसेसिंग डेटा वर्गीकरण
परियोजना
बैंक ग्राहकों के बारे में डेटा का विश्लेषण करें और क्रेडिट योग्य ग्राहकों की हिस्सेदारी निर्धारित करें।
3 स्प्रिंट 2 सप्ताह
अन्वेषणात्मक डेटा विश्लेषण
संभाव्यता और सांख्यिकी की मूल बातें जानें। डेटा के मूल गुणों का पता लगाने, पैटर्न, वितरण और विसंगतियों की तलाश के लिए उनका उपयोग करें। Matplotlib लाइब्रेरी के बारे में जानें। चित्र बनाएं और ग्राफ़ का विश्लेषण करने का अभ्यास करें।
• प्रथम ग्राफ़ और निष्कर्ष। पिवोट टेबल का उपयोग करना। बार चार्ट। वितरण. रेंज आरेख.
• डेटा स्लाइस का अध्ययन. क्वेरी() विधि. दिनांक और समय के साथ कार्य करना. प्लॉट() विधि का उपयोग करके ग्राफ़ प्लॉट करना। ओकाम का उस्तरा.
• अनेक डेटा स्रोतों के साथ कार्य करना। बाहरी वस्तुओं पर आधारित डेटा स्लाइस। डेटाफ़्रेम में नए कॉलम जोड़ना। अन्य डेटाफ़्रेम से डेटा जोड़ना। स्तंभों का नाम बदलना. मर्ज() और जॉइन() विधियों का उपयोग करके तालिकाओं का संयोजन।
• डेटा संबंध. स्कैटर प्लॉट। चरों का सहसंबंध. स्कैटरप्लॉट मैट्रिक्स।
• परिणामों का सत्यापन. समूहों का एकीकरण. डेटा को समूहों में विभाजित करना.
PythonPandasMatplotlibHistogramsडेटा स्लाइसडेटा विश्लेषणस्कैटरप्लॉटस्कैटरप्लॉटडेटा विज़ुअलाइज़ेशनवर्णनात्मक सांख्यिकी
परियोजना
सेंट पीटर्सबर्ग और लेनिनग्राद क्षेत्र में अचल संपत्ति की बिक्री के लिए विज्ञापनों के संग्रह का अन्वेषण करें।
4 स्प्रिंट 3 सप्ताह
सांख्यिकीय डेटा विश्लेषण
सांख्यिकीय विधियों का उपयोग करके डेटा में संबंधों का विश्लेषण करना सीखें। जानें कि सांख्यिकीय महत्व और परिकल्पनाएँ क्या हैं।
• कॉम्बिनेटरिक्स। संयोजन. गुणन नियम. पुनर्व्यवस्था. क्रमपरिवर्तन की संख्या. प्लेसमेंट. नियुक्तियों की संख्या. संयोजन. संयोजनों की संख्या.
• सिद्धांत संभावना। प्रयोग। संभाव्यता स्थान. आयोजन। संभावना। अन्तर्विभाजक और परस्पर अनन्य घटनाएँ। यूलर-वेन आरेख. बड़ी संख्या का नियम.
• वर्णनात्मक आँकड़े। श्रेणीबद्ध और मात्रात्मक चर. मोड और माध्यिका. औसत मूल्य। फैलाव. मानक विचलन। चतुर्थक और शतमक. रेंज आरेख. स्तंभ रेखा - चित्र। आवृत्ति घनत्व. बार चार्ट।
• यादृच्छिक चर। असतत यादृच्छिक चर। असतत यादृच्छिक चर के लिए संभाव्यता वितरण। असतत यादृच्छिक चर का संचयी फलन (वितरण फलन)। असतत यादृच्छिक चर की गणितीय अपेक्षा। असतत यादृच्छिक चर का फैलाव।
• वितरण. बर्नौली का प्रयोग. द्विपद प्रयोग. द्विपद वितरण। निरंतर एक समान वितरण. सामान्य वितरण। मानक सामान्य वितरण. सामान्य वितरण के लिए सीडीएफ और पीपीएफ। पॉसों वितरण। एक वितरण का दूसरे द्वारा अनुमान लगाना।
• परिकल्पनाओं का परीक्षण। सामान्य जनसंख्या। नमूना। नमूने का वितरण। केंद्रीय सीमा प्रमेय। एकतरफ़ा और दोतरफ़ा परिकल्पनाएँ। पी-मूल्य। एक नमूने के लिए एक तरफा और दो तरफा परिकल्पनाओं का परीक्षण करना। दो सामान्य आबादी के साधनों की समानता के बारे में परिकल्पना का परीक्षण करना। आश्रित नमूनों के लिए साधनों की समानता की परिकल्पना का परीक्षण करना।
ScipyNumpyPythonPandasMatplotlibCombinatoricsवितरणपरिकल्पना परीक्षण संभाव्यता सिद्धांत
परियोजना
अपने व्यवसाय को बढ़ाने में मदद के लिए स्कूटर किराये की सेवा परिकल्पनाओं का परीक्षण करें।
अतिरिक्त स्प्रिंट
सिद्धांत संभावना
संभाव्यता सिद्धांत में मूल शब्दों को याद रखें या पहचानें: स्वतंत्र, विपरीत, असंगत घटनाएँ, आदि। सरल उदाहरणों और मज़ेदार समस्याओं का उपयोग करके, आप संख्याओं के साथ काम करने और समाधान के तर्क का निर्माण करने का अभ्यास करेंगे।
यह एक वैकल्पिक स्प्रिंट है. इसका मतलब यह है कि प्रत्येक छात्र स्वयं इनमें से एक विकल्प चुनता है:
• 10 छोटे पाठों के अतिरिक्त स्प्रिंट में महारत हासिल करें, सिद्धांत पर ध्यान दें और समस्याओं का समाधान करें।
• केवल साक्षात्कार कार्यों वाले ब्लॉक को खोलें, सिद्धांत के बिना अभ्यास को याद करें।
• समय और आवश्यकता होने पर पाठ्यक्रम को पूरी तरह छोड़ दें या उस पर वापस लौट आएं।
पायथनइवेंट्सप्रोबेबिलिटीबेयस प्रमेय, रैंडम वेरिएबल्सप्रोबेबिलिटी थ्योरीसांख्यिकीय डेटा विश्लेषण
5 स्प्रिंट 1 सप्ताह
पहले मॉड्यूल का अंतिम प्रोजेक्ट
जानें कि प्रारंभिक डेटा अनुसंधान कैसे करें और परिकल्पनाएँ कैसे तैयार और परीक्षण करें।
ScipyNumpyPythonPandasMatplotlibडेटा विश्लेषण परिकल्पना परीक्षणडेटा प्रोसेसिंग
परियोजना
गेम बिक्री डेटा में पैटर्न खोजें।
6 स्प्रिंट 2 सप्ताह
बुनियादी एसक्यूएल
डेटाबेस के साथ काम करने के लिए संरचित क्वेरी भाषा एसक्यूएल और संबंधपरक बीजगणित की मूल बातें सीखें। एक लोकप्रिय डेटाबेस प्रबंधन प्रणाली (DBMS) PostgreSQL में काम करने की सुविधाओं से परिचित हों। जटिलता के विभिन्न स्तरों की क्वेरीज़ लिखना सीखें और व्यावसायिक समस्याओं का SQL में अनुवाद करें। आप एक ऑनलाइन स्टोर के डेटाबेस के साथ काम करेंगे जो फिल्मों और संगीत में विशेषज्ञता रखता है।
• डेटाबेस का परिचय. डेटाबेस प्रबंधन प्रणाली (डीबीएमएस)। एसक्यूएल भाषा. एसक्यूएल प्रश्न. SQL क्वेरीज़ को फ़ॉर्मेट करना.
• SQL में डेटा स्लाइस. PostgreSQL में डेटा प्रकार। डेटा प्रकार रूपांतरण. कहां कारण। लॉजिकल ऑपरेटर्स। डेटा स्लाइस. संचालकों में, जैसे, बीच में। दिनांक और समय के साथ कार्य करना. लुप्त मानों को संभालना. सशर्त CASE निर्माण.
• एकत्रीकरण कार्य। डेटा को समूहीकृत करना और क्रमबद्ध करना। गणितीय संक्रियाएँ. एकत्रीकरण कार्य. डेटा समूहीकरण. डेटा क्रमबद्ध करना. एकत्रित डेटा द्वारा फ़िल्टर करना, HAVING ऑपरेटर।
• तालिकाओं के बीच संबंध. टेबल जॉइन के प्रकार. ईआर आरेख. फ़ील्ड और तालिकाओं का नाम बदलना. उपनाम. तालिकाओं का विलय. जुड़ने के प्रकार: आंतरिक जोड़, बायाँ जोड़, दायाँ जोड़, पूर्ण बाहरी जोड़। यूनियनों के वैकल्पिक प्रकार यूनियन और यूनियन सभी।
• उपश्रेणियाँ और सामान्य तालिका अभिव्यक्तियाँ। उपश्रेणियाँ। FROM में उपश्रेणियाँ। कहाँ में उपश्रेणियाँ। जॉइन और सबक्वेरी का संयोजन। सामान्य तालिका अभिव्यक्तियाँ (सीटीई)। अनुरोधों की परिवर्तनशीलता.
SQLDBMSPostgreSQLSubqueriesडेटाबेसSQL क्वेरीज़ डेटा फ़िल्टर करना डेटा सॉर्ट करना डेटा समूह बनाना तालिकाओं में शामिल होना सामान्य तालिका अभिव्यक्तियाँ
परियोजना
आप एक डेटाबेस में अलग-अलग जटिलता के प्रश्नों की एक श्रृंखला लिखेंगे जो उद्यम निवेशकों, स्टार्टअप और उनमें निवेश पर डेटा संग्रहीत करता है।
7 स्प्रिंट 3 सप्ताह
व्यावसायिक संकेतकों का विश्लेषण
जानें कि व्यवसाय में मेट्रिक्स क्या हैं। व्यवसाय में डेटा विश्लेषण के लिए टूल का उपयोग करना सीखें: समूह विश्लेषण, बिक्री फ़नल और इकाई अर्थशास्त्र।
• मेट्रिक्स और फ़नल. रूपांतरण. फ़नल. मार्केटिंग फ़नल. इंप्रेशन. क्लिक. सीटीआर. उत्पाद फ़नल.
• समूह विश्लेषण. उपयोगकर्ता रूपरेखा। अवधारण दर। मथना दर। विश्लेषण क्षितिज. समूह विश्लेषण का विज़ुअलाइज़ेशन. यादृच्छिक समूहों का अवधारण विश्लेषण। समूह विश्लेषण में रूपांतरण. पायथन में मेट्रिक्स की गणना।
• इकाई अर्थशास्त्र. मेट्रिक्स एलटीवी, सीएसी, आरओआई। एआरपीयू, एआरपीपीयू। पायथन में मेट्रिक्स की गणना। मेट्रिक्स का उन्नत विज़ुअलाइज़ेशन. शेयरी पैरामीटर. औसत चलन।
• कस्टम मेट्रिक्स. उपयोगकर्ता गतिविधि मूल्यांकन. उपयोगकर्ता सत्र. विसंगति जांच.
मेट्रिक्सफ़नलरूपांतरणइकाई अर्थशास्त्र समूह विश्लेषणउत्पाद मेट्रिक्सविपणन मेट्रिक्स
परियोजना
डेटा के आधार पर, उपयोगकर्ता के व्यवहार को समझें, साथ ही विपणन विभाग के लिए सिफारिशें करने के लिए ग्राहक लाभप्रदता और विज्ञापन आरओआई का विश्लेषण करें।
8 स्प्रिंट 2 सप्ताह
उन्नत एसक्यूएल
आप डेटाबेस के साथ काम करने पर एक अतिरिक्त पाठ्यक्रम लेंगे और व्यवसाय के और भी करीब हो जाएंगे। SQL भाषा का उपयोग करते हुए, आप उन मुख्य व्यावसायिक मेट्रिक्स की गणना का विश्लेषण करेंगे जिनसे आप "बिजनेस संकेतक विश्लेषण" स्प्रिंट में परिचित हुए थे। विंडो फ़ंक्शंस जैसे जटिल टूल के साथ काम करने पर विचार करें। पायथन के लिए विशेष क्लाइंट प्रोग्राम और लाइब्रेरी का उपयोग करके, सिम्युलेटर के बिना, स्थानीय रूप से डेटाबेस की सामग्री को बदलना सीखें।
• व्यावसायिक संकेतकों की गणना। डेटा स्कीमा. रूपांतरण. एलटीवी. एआरपीयू. एआरपीपीयू. आरओआई. एसक्यूएल का उपयोग करके गणना।
• विंडो फ़ंक्शंस को एकत्रित करना। अति अभिव्यक्ति. विंडो पैरामीटर द्वारा विभाजन.
• विंडो रैंकिंग फ़ंक्शन। रैंकिंग कार्य. ऑपरेटर द्वारा विंडो ऑर्डर। पंक्ति नंबर()। पद()। DENSE_RANK(). NTILE(). रैंकिंग कार्यों के साथ विंडो ऑपरेटर।
• विंडो ऑफसेट फ़ंक्शन। संचयी मान. ऑफसेट कार्य. नेतृत्व करना()। अंतराल()। विंडो फ़ंक्शंस और उपनाम।
• समूह विश्लेषण. प्रतिधारण दर, मंथन दर। एलटीवी.
• डेटाबेस और डेटाबेस क्लाइंट की स्थापना और कॉन्फ़िगरेशन। डेटाबेस क्लाइंट. पोस्टग्रेएसक्यूएल स्थापित करना। डीबीवर स्थापित करना। डीबीवर इंटरफ़ेस। डेटाबेस निर्माण. डेटाबेस डंप तैनात करना। क्वेरी परिणाम अपलोड हो रहा है. क्वेरी परिणामों की प्रस्तुति.
SQLDBMSMetricsPostgreSQLDatabasesSQL क्वेरीज़विंडो फ़ंक्शन समूह विश्लेषण
परियोजना
पायथन और एसक्यूएल का उपयोग करके, डेटाबेस से कनेक्ट करें, प्रोग्रामिंग क्यू एंड ए सेवा प्रणाली में प्रमुख मेट्रिक्स की गणना और कल्पना करें।
9 स्प्रिंट 2 सप्ताह
व्यवसाय में निर्णय लेना
आप सीखेंगे कि ए/बी परीक्षण क्या है और यह समझेंगे कि इसका उपयोग किन मामलों में किया जाता है। ए/बी परीक्षण डिज़ाइन करना और उसके परिणामों का मूल्यांकन करना सीखें।
• व्यवसाय में परिकल्पना परीक्षण के मूल सिद्धांत। अग्रणी मेट्रिक्स. प्रयोगों के आधार. परिकल्पनाओं का निर्माण. मेट्रिक्स का प्राथमिकताकरण. किसी प्रयोग के संचालन के लिए एक विधि का चयन करना। परिकल्पनाओं के परीक्षण के लिए गुणात्मक तरीके। परिकल्पनाओं के परीक्षण के लिए मात्रात्मक तरीके। ए/बी परीक्षणों के फायदे और नुकसान।
• परिकल्पनाओं को प्राथमिकता देना। चावल ढांचा। पैरामीटर तक पहुंचें. प्रभाव पैरामीटर. आत्मविश्वास पैरामीटर. प्रयास पैरामीटर.
• ए/बी परीक्षण आयोजित करने की तैयारी। ए/ए परीक्षण. टाइप I और II त्रुटियाँ। सांख्यिकीय परीक्षण की शक्ति. सांख्यिकीय परीक्षण का महत्व. एकाधिक तुलनाएँ, त्रुटि की संभावना को कम करने के तरीके। ए/बी परीक्षण के नमूना आकार और अवधि की गणना। मेट्रिक्स का चित्रमय विश्लेषण।
• ए/बी परीक्षण परिणामों का विश्लेषण। शेयरों की समानता की परिकल्पना का परीक्षण करना। डेटा सामान्यता का परीक्षण करने के लिए शापिरो-विल्क परीक्षण। गैर-पैरामीट्रिक सांख्यिकीय परीक्षण। मान-व्हिटनी परीक्षण. संचयी मेट्रिक्स की स्थिरता. आउटलेर्स और बर्स्ट का विश्लेषण।
• व्यवहार एल्गोरिदम. तथ्य, भावनाएँ, आकलन। अपना दृष्टिकोण स्पष्ट करें.
ए/बी परीक्षण परिकल्पनाओं को प्राथमिकता देना ए/बी परीक्षण के लिए तैयारी ए/बी परीक्षण परिणामों का विश्लेषण ए/बी परीक्षण परिणामों का विश्लेषण
परियोजना
एक बड़े ऑनलाइन स्टोर में ए/बी परीक्षण के परिणामों का विश्लेषण करें।
10 स्प्रिंट 1 सप्ताह
दूसरे मॉड्यूल की अंतिम परियोजना
ए/बी परीक्षण का उपयोग करके सांख्यिकीय परिकल्पनाओं का परीक्षण करना सीखें और विश्लेषणात्मक रिपोर्ट प्रारूप में निष्कर्ष और सिफारिशें तैयार करें।
बिक्री फ़नलए/बी परीक्षणडेटा प्रोसेसिंगअनुसंधान डेटा विश्लेषण
परियोजना
बिक्री फ़नल का अन्वेषण करें और मोबाइल एप्लिकेशन में ए/बी परीक्षण के परिणामों का विश्लेषण करें।
11 स्प्रिंट 2 सप्ताह
डेटा के साथ कहानी कैसे बताएं
आप सीखेंगे कि ग्राफ़, सबसे महत्वपूर्ण आंकड़ों और उनकी सही व्याख्या का उपयोग करके अपने शोध के परिणामों को सही ढंग से कैसे प्रस्तुत किया जाए। सीबॉर्न और प्लॉटली लाइब्रेरी के बारे में जानें।
• किसे, कैसे, क्या और क्यों बताना है। शोध परिणाम की प्रस्तुति. कथावाचक के लक्षित दर्शक. डेटा विश्लेषक को क्या और क्यों बताना चाहिए?
• सीबॉर्न लाइब्रेरी। सीबॉर्न लाइब्रेरी मैटप्लोटलिब लाइब्रेरी के विस्तार के रूप में। जॉइंटप्लॉट() विधि। रंग श्रेणियाँ. चार्ट शैलियाँ. वितरण का दृश्य.
• प्लॉटली लाइब्रेरी। इंटरैक्टिव ग्राफ़. लाइन ग्राफ। स्तंभ रेखा - चित्र। पाई चार्ट। फ़नल चार्ट.
• जियोएनालिटिक्स में डेटा विज़ुअलाइज़ेशन। जियोएनालिटिक्स। लाइब्रेरी फोलियम. मानचित्र प्रदर्शन. निर्दिष्ट निर्देशांक के साथ मार्कर सेट करना। बिंदु क्लस्टर बनाना. मार्करों के लिए कस्टम चिह्न. होरोप्लेट.
• प्रेजेंटेशन तैयार करना. अध्ययन के आधार पर निष्कर्ष. मौसमी और बाहरी कारक। निरपेक्ष और सापेक्ष मूल्य. सिम्पसन का विरोधाभास. प्रस्तुतियाँ बनाने के सिद्धांत. ज्यूपिटर नोटबुक में रिपोर्ट।
प्लॉटलीफोलियमसीबॉर्नमैटप्लॉटलिबप्रेजेंटेशनजियोएनालिटिक्सडेटा विज़ुअलाइज़ेशन
परियोजना
मॉस्को में सार्वजनिक खानपान प्रतिष्ठानों के बारे में खुले आंकड़ों के आधार पर एक बाजार अध्ययन तैयार करें, प्राप्त आंकड़ों की कल्पना करें।
12 स्प्रिंट 2 सप्ताह
झांकी में डैशबोर्ड का निर्माण
इस स्प्रिंट में आप Tableau BI सिस्टम के साथ काम करेंगे। डेटा से जुड़ना और उसे संशोधित करना सीखें, विभिन्न प्रकार के ग्राफ़ बनाएं, डैशबोर्ड और प्रस्तुतियाँ इकट्ठा करें।
• झांकी के साथ काम करने की मूल बातें। बीआई सिस्टम। झाँकी. दस्तावेज़ बनाना. दस्तावेज़ सहेजा जा रहा है. दस्तावेज़ का प्रकाशन.
• डेटा स्रोतों के साथ कार्य करना। डेटा स्रोत। डेटा मर्जिंग. संबंध विधि. जुड़ने की विधि. मिश्रण विधि. संघ विधि. तालिका स्वरूप बदलना.
• डेटा के प्रकार। बुनियादी डेटा प्रकार. माप। पैमाने। दिनांक और समय के साथ कार्य करना. सेट. समूह. विकल्प. वेरिएबल्स का प्रारूप बदलना. चर नाम मापें, मान मापें, गिनती करें।
• तालिकाएँ और गणनाएँ। शीट संपादन इंटरफ़ेस. पिवट तालिकाएं। परिकलित फ़ील्ड. एलओडी अभिव्यक्तियाँ.
• फ़िल्टर और छँटाई। छँटाई के उपाय. आयामों को क्रमबद्ध करना। नेस्टेड प्रकार. एक पैरामीटर का उपयोग करके क्रमबद्ध करना. फिल्टर.
• विज़ुअलाइज़ेशन. विज़ुअलाइज़ेशन नियंत्रण. ताप मानचित्र. पाइ चार्ट्स। कॉलम चार्ट. हिस्टोग्राम। रेंज आरेख. तितरबितर आकृति। रेखा रेखांकन. संयुक्त रेखांकन. क्षेत्र चार्ट.
• विशेष विज़ुअलाइज़ेशन और टूलटिप्स। पत्ते। चरित्र नक्शा। बबल चार्ट. वृक्ष मानचित्र. वृत्त दृश्य आरेख. बुलेट आरेख. गंत्त चार्ट। विज़ुअलाइज़ेशन में नाम मापें और मान मापें। रिवर्स इंजीनियरिंग। टूलटिप्स. विज़ुअलाइज़ेशन के साथ टूलटिप्स. ग्राफ़ पर सीमा मान. कस्टम में विश्लेषणात्मक उपकरण.
• प्रस्तुतियाँ। अतिरिक्त विकल्प. विशिष्ट मापदंडों का अध्ययन. एक प्रस्तुति बनाना.
• डैशबोर्ड. डेटा लोड करना और तैयार करना. विज़ुअलाइज़ेशन तैयार करना. डैशबोर्ड असेंबली. क्रियाएँ। डैशबोर्ड प्रदर्शन. डैशबोर्ड प्रकाशित करना.
टेबलौडैशबोर्डबीआई-टूल्सबीआई-टूल्सडेटा विज़ुअलाइज़ेशन
परियोजना
TED सम्मेलनों के इतिहास पर शोध करें और प्राप्त आंकड़ों के आधार पर Tableau में एक डैशबोर्ड बनाएं।
अतिरिक्त स्प्रिंट
मशीन लर्निंग मूल बातें
मशीन लर्निंग की बुनियादी बातों से परिचित हों और व्यवसाय में मशीन लर्निंग के मुख्य कार्यों के बारे में जानें।
पायथनपांडास्केलर्नमशीन लर्निंगमशीन लर्निंग कार्यमशीन लर्निंग एल्गोरिदम
अतिरिक्त स्प्रिंट
पायथन का अभ्यास करें
आप पायथन प्रोग्रामिंग भाषा में अतिरिक्त कार्यों के साथ कई प्रयोगशाला कक्षाएं लेंगे। आप यह भी सीखेंगे कि वेब संसाधनों से डेटा कैसे निकाला जाए।
आप करेंगे:
• HTML पृष्ठों की संरचना और GET अनुरोधों के संचालन में,
• सरल नियमित अभिव्यक्ति लिखना सीखें,
• API और JSON को जानें,
• साइटों से कई अनुरोध करें और डेटा एकत्र करें।
JSONPythonREST APIवेब स्क्रैपिंग
13 स्प्रिंट 3 सप्ताह
स्नातक परियोजना
अंतिम प्रोजेक्ट में, पुष्टि करें कि आपने एक नए पेशे में महारत हासिल कर ली है। ग्राहक के कार्य को स्पष्ट करें और डेटा विश्लेषण के सभी चरणों से गुजरें। अब कोई पाठ या होमवर्क नहीं है - सब कुछ वास्तविक नौकरी जैसा है।
अंतिम स्प्रिंट में प्रोजेक्ट कार्य, ए/बी परीक्षण और एसक्यूएल कार्य और एक अतिरिक्त कार्य शामिल है। प्रोजेक्ट में समस्या का विवरण, अपेक्षित परिणाम, डेटा का एक सेट और उनका विवरण शामिल है।
यह कार्य पाँच व्यावसायिक क्षेत्रों में से एक से संबंधित है:
• बैंक,
• खुदरा,
• खेल,
• मोबाइल एप्लीकेशन,
• ई-कॉमर्स.
प्रोजेक्ट में चरणों का कोई सामान्य विवरण नहीं होगा. आप स्वयं उनके माध्यम से काम करेंगे.
एसक्यू एलपीथॉन पांडासटेबल्यू डैशबोर्ड पोस्टग्रे एसक्यूएल डीकंपोजिशन ए/बी परीक्षण