पायथन और डेटाबेस (एसक्यूएल) में डेटा विश्लेषण - RANEPA से निःशुल्क पाठ्यक्रम, प्रशिक्षण, दिनांक: 6 मार्च, 2023।
अनेक वस्तुओं का संग्रह / / December 04, 2023
पायथन डेटा विश्लेषण और डेटाबेस (एसक्यूएल) कार्यक्रम छात्रों को पायथन भाषा का उपयोग करके प्रोग्रामिंग एमएल (मशीन लर्निंग) एल्गोरिदम के बुनियादी सिद्धांतों की समझ प्रदान करेगा। यह आपको आधुनिक रिलेशनल डेटाबेस के प्रबंधन के क्षेत्र में कई दक्षताओं में महारत हासिल करने में भी मदद करेगा और डीबीएमएस भाषा उपकरण (डेटाबेस प्रबंधन सिस्टम) का उपयोग करने में व्यावहारिक कौशल हासिल करें डेटा)।
व्यवसाय और सरकार में, बड़ी मात्रा में डेटा का लगातार विश्लेषण करने की आवश्यकता होती है काम की गुणवत्ता को नियंत्रित करने, नए विचारों को सामने रखने और स्वीकृत विचारों को सही ठहराने के लिए जानकारी प्राप्त करें निर्णय. जो विशेषज्ञ बड़ी मात्रा में डेटा को समझते हैं, वे प्रभावशाली वेतन के साथ फास्ट-ट्रैक करियर की उम्मीद कर सकते हैं।
एक नियम के रूप में, डेटा विश्लेषण से संबंधित नौकरी विज्ञापनों में SQL और Python का सबसे अधिक उल्लेख किया जाता है।
केवल वे छात्र जो निम्नलिखित क्षेत्रों में अध्ययन नहीं कर रहे हैं वे पाठ्यक्रम के लिए आवेदन कर सकते हैं:
कार्यक्रम में महारत हासिल करने के दौरान, छात्रों को नए डिजिटल उत्पादों (स्वतंत्र रूप से या एक टीम में) के साथ आने का अवसर मिलेगा। सर्वोत्तम समाधानों के लेखकों को अकादमी का समर्थन और आर्टिफिशियल इंटेलिजेंस प्रयोगशाला और RANEPA की प्लेटफ़ॉर्म डेवलपमेंट प्रयोगशाला के साथ सहयोग करने का अवसर मिलेगा।
अजगर
यह कैसे काम करता है? पायथन विशेषताएँ।
हर कोई Python का उपयोग क्यों कर रहा है? अन्य प्रोग्रामिंग भाषाओं के साथ तुलना। प्रोग्राम कैसे लिखें? पायथन के पेशेवर. कार्यों में पायथन का उपयोग कैसे करें: वर्ड प्रोसेसिंग, छवियों के साथ काम करना, स्टॉक रोबोट लिखना, चैट बॉट लॉन्च करना। पायथन में इनपुट और आउटपुट। पायथन में नाम. बुनियादी संचालन। कार्यक्रम निष्पादन प्रगति का नियंत्रण (सशर्त निर्माण)। सरल कार्यक्रमों के उदाहरण.
चक्र. पंक्तियाँ। स्ट्रिंग विधियाँ.
पूर्व शर्त के साथ लूप. कथनों को तोड़ें और जारी रखें। पाश के लिए लाइन संरचना और लाइन की लंबाई. रेखा तत्व और रेखाओं को कैसे काटें। एक स्ट्रिंग से एक सबस्ट्रिंग प्राप्त करना। लाइन ट्रैवर्सल. अनुभाग.
टुपल्स. सूचियाँ। फ़ंक्शन मानचित्र. यादृच्छिक मूल्य सूची जनरेटर।
टुपल्स की आवश्यकता क्यों है? एक सूची के साथ कार्य करना. तत्वों की सूची बनाएं. सूची प्रिंट करें. सूचियों की सही नकल. मानचित्र फ़ंक्शन का उपयोग करने की विशेषताएं. यादृच्छिक मूल्य जनरेटर क्या हैं? गुच्छा। सेट के साथ संचालन. जमे हुए सेट। शब्दकोश। विधि प्राप्त करें शब्दकोश परिभ्रमण.
कार्य. गणितीय कार्यों का अनुप्रयोग. दायरा और बहिष्करण.
फ़ंक्शंस को सही तरीके से कैसे लिखें। सरल एल्गोरिदम. पहला कार्य लिखना. गणित कैसे जोड़ें. अपने स्वयं के फ़ंक्शन लिखने के लिए सिफ़ारिशें. स्कोप कैसे काम करते हैं. सार्वत्रिक चर। किसी फ़ंक्शन से एकाधिक मान लौटाना। अपवाद.
फाइलों के साथ काम करना. मैट्रिक्स। छँटाई के प्रकार
आप फ़ाइलों के साथ क्या कर सकते हैं? फ़ाइलें खोलना और बंद करना. टेक्स्ट फ़ाइलें पढ़ना और लिखना. मैट्रिक्स। मैट्रिक्स भरना. मैट्रिक्स को पंक्ति दर पंक्ति दर्ज करना। मैट्रिक्स पढ़ना और लिखना. बुलबुले की तरह। एल्गोरिथम का विश्लेषण. समाधान के कई संस्करण.
NumPy लाइब्रेरी का अवलोकन. NumPy फ़ंक्शंस के साथ कार्य करना। SciPY लाइब्रेरी।
पायथन पुस्तकालय और उनकी स्थापना। मूल NumPy डेटा प्रकार। संख्यात्मक कार्य. सरणियों के साथ कार्य करना. सरणियों के साथ संचालन. द्वि-आयामी सरणियाँ। मैट्रिक्स। SciPy लाइब्रेरी की बुनियादी विशेषताएं।
पंडों की लाइब्रेरी का अवलोकन. बुनियादी विश्लेषण.
पुस्तकालय स्थापित करना. एक श्रृंखला वस्तु बनाना। डेटाफ़्रेम अनुक्रमण. टेबल्स। फ़ाइलें पढ़ना और लिखना. अनुक्रमणिका। डेटा नमूनाकरण. पंक्तियों और स्तंभों के साथ संचालन. NaN के साथ कार्य करना. छँटाई।
डेटा विज़ुअलाइज़ेशन. व्यावहारिक उदाहरण
नए डेटा का अध्ययन, प्रीप्रोसेसिंग, डेटा विज़ुअलाइज़ेशन, सुविधाओं के बीच कनेक्शन की खोज, प्रशिक्षण डेटा तैयार करना और क्रेडिट जोखिम पूर्वानुमान मॉडल बनाना। एक मॉडल प्राप्त करना जो प्रश्न का उत्तर देता है: ऋण जारी करना या न जारी करना।
नियमित कार्यों का स्वचालन. व्यावहारिक उदाहरण
कई स्रोतों (एक्सेल फ़ाइलें) या इंटरनेट से एकत्रित जानकारी प्राप्त करने से संबंधित कार्यों के स्वचालन के व्यावहारिक उदाहरणों का विश्लेषण।
डेटा विश्लेषण के लिए उपयोग की जाने वाली मशीन लर्निंग विधियों की समीक्षा। व्यावहारिक उदाहरण
पर्यवेक्षित शिक्षण समस्या में बुनियादी विशेषताओं की पहचान और उनकी व्याख्या का एक व्यावहारिक उदाहरण।
अंतरिम मॉड्यूल मूल्यांकन
अंतरिम प्रमाणीकरण एक परीक्षण (कंप्यूटर परीक्षण) के रूप में होता है। एक विशिष्ट परीक्षण भवन का नमूना:
किसी वेरिएबल के प्रकार का पता लगाने के लिए आप किस पायथन फ़ंक्शन का उपयोग कर सकते हैं?
- ह्वाओमी
- प्रकार
- के प्रकार
- है
निम्नलिखित कोड में संख्याओं की कौन सी श्रेणी बनाई जाएगी: श्रेणी (9, 3, -2)
- 9 8 7 6 5 4 4
- 9 7 5 3
- 9 7 5
- 11 9 8 7 6 5 4
लिस्टिंग में कोड स्निपेट आपको क्या निष्पादित करने की अनुमति देता है?
- कोड स्निपेट: प्रिंट(math.sqrt(2))
- गणित पुस्तकालय से संख्या 2 प्रदर्शित करना
- गणित पुस्तकालय को जोड़ना
- एक गणित संख्या का वर्ग निकालना
- दो का वर्गमूल प्रदर्शित करना
एसक्यूएल
डेटा भंडारण और अखंडता.
डेटा भंडारण: डेटा फ़ाइलें, लॉग, RAID स्तर, Tempdb। डेटाबेस में संबंध, एक से एक, एक से अनेक, अनेक से अनेक। डेटा अखंडता: प्राथमिक कुंजी, चेक, अद्वितीय और विदेशी कुंजी। तालिकाओं का सामान्यीकरण.
डेटाबेस और टेबल बनाना।
डीबीएमएस आर्किटेक्चर: तार्किक (टेबल और डेटा प्रकार, कुंजी, इंडेक्स, दृश्य, असेंबली, बाधाएं, नियम, डिफ़ॉल्ट मान) और भौतिक स्तर (फ़ाइलें और फ़ाइल समूह, पेज)। डेटाबेस निर्माण. तालिका फ़ील्ड डेटा प्रकार: सटीक संख्याएँ, यूनिकोड वर्ण स्ट्रिंग, अनुमानित संख्याएँ, बाइनरी डेटा, दिनांक और समय, अन्य डेटा प्रकार, वर्ण स्ट्रिंग। टेबल बनाना. अनुरोध कहां लिखें?
सूचकांक। आरेख.
इंडेक्स: क्लस्टर्ड, नॉन-क्लस्टर्ड, यूनिक आइडेंटिफिकेशन, फिल्टर्ड, कॉलमस्टोर, हैश, नॉन-क्लस्टर्ड, मेमोरी ऑप्टिमाइज्ड इंडेक्स। ईआर आरेख: डेटाबेस आरेख, डेटाबेस नोड। डीएमएल और सबसे आम एसक्यूएल ऑपरेटर: चयन करें, सम्मिलित करें, अद्यतन करें, हटाएं। अद्वितीय कारकों का महत्व.
अनुरोध. बाहरी संबंध.
एक टेबल पर प्रश्न. दोहराव के बिना नमूनाकरण. एकाधिक तालिकाओं पर प्रश्न. बाहरी जोड़: बाएँ, दाएँ या पूर्ण।
समग्र कार्य. उपश्रेणियाँ।
उपश्रेणी: कहां गिनती, योग, औसत, अधिकतम, न्यूनतम, में, सभी, कोई भी। जॉइनिंग डेटा: जॉइन चुनें। समग्र कार्य: AVG, CHECKSUM_AGG, COUNT, COUNT_BIG, ग्रुपिंग, ग्रुपिंग_ID, MAX, MIN, STDEV, STDEVP, STRING_AGG, SUM, VAR, VARP। समग्र कार्यों के लिए शर्तें.
उपयोगी विशेषताएँ.
ऑपरेटरों के बारे में थोड़ा और। औद्योगिक अनुरोध. उपयोगी कार्य: SQRT, RAND, CONCAT, संख्यात्मक और स्ट्रिंग फ़ंक्शन। ऑपरेशन प्राथमिकता और प्रकार रूपांतरण: CAST, CONVERT।
लेन-देन. प्रतिनिधित्व.
एक निवेदन चार प्रकार का। लेनदेन: लेनदेन की अवधारणा - परमाणुता, स्थिरता, अलगाव, स्थायित्व, लेनदेन प्रबंधन - कमिट, रोलबैक, सेवपॉइंट, सेट लेनदेन। समानांतर डेटा पहुंच: गंदे, गैर-दोहराए जाने योग्य पढ़ने, प्रेत की समस्याएं। दृश्य: अनुक्रमित, विभाजित, सिस्टम।
चर और लूप.
प्रोग्रामिंग की शुरुआत. चर: घोषित करें, सेट करें, चुनें। कोड संरचना. डेटा विवरण ऑपरेटर: बनाएं, ड्रॉप करें, बदलें, आदि। डेटा हेरफेर ऑपरेटर: सम्मिलित करें, हटाएं, चयन करें, अद्यतन करें, आदि। डेटाबेस में एक्सेस अधिकार सेट करने के लिए ऑपरेटर: सुरक्षा, डेटा रिकवरी और अन्य ऑपरेटरों के लिए अनुदान / निरस्त, लॉक / अनलॉक, सेट लॉक मोड ऑपरेटर। चक्र: जबकि।
संग्रहित प्रक्रियाएँ और कार्य।
अस्थायी टेबल. ट्रांजैक्ट-एसक्यूएल कर्सर, सर्वर, क्लाइंट। कर्सर प्रकार: यूनिडायरेक्शनल, स्थिर, कीसेट, गतिशील। संग्रहित प्रक्रियाएं और कार्य: प्रक्रिया बनाएं, प्रोसी बनाएं।
ट्रिगर. अपवाद.
कन्वेयर एचएफ. ट्रिगर: बाद में, इसके स्थान पर। अपवाद: सिवाय. डायनेमिक SQL कीवर्ड का उपयोग करके और संग्रहीत प्रक्रिया का उपयोग करके: तत्काल निष्पादित करें।
डीबीएमएस। नोएसक्यूएल डेटाबेस।
प्रोग्रामिंग/डीबीएमएस/एसक्यूएल में लेनदेन। अनुरोधों को कैसे निष्पादित किया जाता है. क्वेरी प्रदर्शन में सुधार कैसे करें. NoSQL डेटाबेस और इसके फायदे।
अंतरिम मॉड्यूल मूल्यांकन
अंतरिम प्रमाणीकरण एक परीक्षण (कंप्यूटर परीक्षण) के रूप में होता है। एक विशिष्ट परीक्षण भवन का नमूना:
NUMBER किस प्रकार का फ़ील्ड डेटा है?
- डोरी
- संख्यात्मक
- द्विआधारी
कौन सा SQL कमांड डेटा से पूछताछ करता है?
- ऑल्टर
- चुनना
- से
लेन-देन क्या है?
- यह DBMS द्वारा निष्पादित ऑपरेशनों का एक समूह है
- ऑपरेशनों का एक समूह है जिसमें ACID गुण होते हैं
- यह SQL कमांड निष्पादित करने का ऑपरेशन है