मशीन लर्निंग का विकास - डेटा विश्लेषण स्कूल से निःशुल्क पाठ्यक्रम, प्रशिक्षण 4 सेमेस्टर, दिनांक: 2 दिसंबर, 2023।
अनेक वस्तुओं का संग्रह / / December 06, 2023
यह दिशा उन लोगों के लिए उपयुक्त है जो उन सेवाओं और अनुप्रयोगों को प्रोग्राम करना और बनाना पसंद करते हैं जिनका उपयोग हजारों और लाखों लोगों द्वारा किया जा सकता है।
प्रभावी कोड लिखें, औद्योगिक रूप से कुशल डेटा-संचालित सिस्टम बनाएं और अनुकूलित करें।
मशीन लर्निंग पर आधारित उच्च तकनीक उत्पादों के विकास में।
प्रत्येक छात्र को सेमेस्टर के दौरान कम से कम तीन पाठ्यक्रम सफलतापूर्वक पूरा करना होगा। उदाहरण के लिए, यदि मुख्य कार्यक्रम में उनमें से दो हैं, तो आपको विशेष पाठ्यक्रमों में से एक को चुनना होगा।
ज्ञान का परीक्षण मुख्य रूप से होमवर्क के माध्यम से किया जाता है - परीक्षा और परीक्षण केवल कुछ विषयों में आयोजित किए जाते हैं।
पहला सेमेस्टर
अनिवार्य
एल्गोरिदम और डेटा संरचनाएं, भाग 1
01जटिलता और कम्प्यूटेशनल मॉडल। लेखांकन मूल्यों का विश्लेषण (शुरुआत)
02लेखांकन मूल्यों का विश्लेषण (अंत)
03मर्ज-सॉर्ट और क्विक-सॉर्ट एल्गोरिदम
04सामान्य आँकड़े। ढेर (शुरुआत)
05हीप्स (अंत)
06हैशिंग
07पेड़ खोजें (प्रारंभ)
08पेड़ खोजें (जारी)
09पेड़ खोजें (अंत). असंयुक्त समुच्चयों की प्रणाली
आरएमक्यू और एलसीए की 10 समस्याएं
11ज्यामितीय खोज के लिए डेटा संरचनाएँ
12अप्रत्यक्ष ग्राफ़ में गतिशील कनेक्टिविटी की समस्या
C++ भाषा प्रशिक्षण, भाग 1
C++ समृद्ध विरासत वाली एक शक्तिशाली भाषा है। जो लोग अभी-अभी इस भाषा में महारत हासिल करने की राह पर निकले हैं, उनके लिए पिछले 30 वर्षों में बनाई गई तकनीकों और तकनीकों की प्रचुरता में खो जाना बहुत आसान है। पाठ्यक्रम "आधुनिक सी++" सिखाता है - भाषा का एक आधुनिक उपसमुच्चय (मानक 11, 14 और 17)। उपकरणों और पुस्तकालयों पर बहुत अधिक ध्यान दिया जाता है - ऐसी चीजें जो भाषा का हिस्सा नहीं हैं, लेकिन जिनके बिना एक बड़ी और जटिल परियोजना बनाना संभव नहीं होगा।
01सी++ का परिचय।
02 स्थिरांक. सूचक और लिंक. किसी फ़ंक्शन में तर्क पारित करना।
03कक्षाएँ।
04गतिशील स्मृति प्रबंधन।
05चर, सूचक और संदर्भ।
06मेमोरी प्रबंधन, स्मार्ट पॉइंटर्स, आरएआईआई।
07मानक टेम्पलेट लाइब्रेरी।
08विरासत और आभासी कार्य।
09त्रुटि प्रबंधन.
10डिज़ाइन पैटर्न।
11नेमस्पेस मूव सिमेंटिक्स उत्तम अग्रेषण।
12स्मृति में संरचनाओं और वर्गों का प्रतिनिधित्व। डेटा संरेखण. कक्षा के सदस्यों/विधियों की ओर संकेत। विविध टेम्पलेट्स.
मशीन लर्निंग, भाग 1
01बुनियादी अवधारणाएँ और व्यावहारिक समस्याओं के उदाहरण
02मीट्रिक वर्गीकरण विधियाँ
03तार्किक वर्गीकरण विधियाँ और निर्णय वृक्ष
04क्रमिक रैखिक वर्गीकरण विधियाँ
05वेक्टर मशीन का समर्थन करें
06 बहुभिन्नरूपी रैखिक प्रतिगमन
07अरेखीय और गैरपैरामीट्रिक प्रतिगमन, गैर-मानक हानि फ़ंक्शन
08समय श्रृंखला का पूर्वानुमान
09बायेसियन वर्गीकरण विधियाँ
10 लॉजिस्टिक रिग्रेशन
11 एसोसिएशन नियमों की खोज करें
दूसरी अवधि
अनिवार्य
मशीन लर्निंग, भाग 2
01वर्गीकरण और प्रतिगमन के तंत्रिका नेटवर्क तरीके
02वर्गीकरण और प्रतिगमन की संरचनागत विधियाँ
03 मॉडलों के चयन के लिए मानदंड और सुविधाओं के चयन के लिए तरीके
04रैंकिंग
05सुदृढीकरण सीखना
06शिक्षक के बिना सीखना
07आंशिक प्रशिक्षण में समस्याएँ
08सहयोगात्मक फ़िल्टरिंग
09विषय मॉडलिंग
से चुनने के लिए
एल्गोरिदम और डेटा संरचनाएं, भाग 2
01चौड़ाई में बाईपास। गहराई प्रथम ट्रैवर्सल (प्रारंभ)
02 गहराई क्रॉल (जारी)
03 गहराई क्रॉल (अंत) । 2-कटौती
04सबसे छोटा रास्ता ढूँढना (शुरुआत)
05सबसे छोटा रास्ता ढूँढना (जारी)
06न्यूनतम फैले हुए पेड़
07न्यूनतम कटौती. सबस्ट्रिंग खोजें (प्रारंभ)
08 सबस्ट्रिंग्स की खोज करें (जारी)
09उपस्ट्रिंग खोजें (अंत)
10प्रत्यय वृक्ष (शुरुआत)
11प्रत्यय वृक्ष (समाप्त) । प्रत्यय सरणियाँ (प्रारंभ)
12प्रत्यय सारणी (अंत)
13सबसे लंबी सामान्य उपस्ट्रिंग. अनुमानित सबस्ट्रिंग खोज.
या
पायथन भाषा
01भाषा की मूल बातें (भाग 1)
02भाषा की मूल बातें (भाग 2)
03ऑब्जेक्ट-ओरिएंटेड प्रोग्रामिंग
04त्रुटि प्रबंधन
05कोड डिजाइन और परीक्षण
06स्ट्रिंग्स के साथ कार्य करना
07मेमोरी मॉडल
08कार्यात्मक प्रोग्रामिंग
09पुस्तकालय समीक्षा (भाग 1)
10लाइब्रेरी समीक्षा (भाग 2)
11पायथन में समानांतर कंप्यूटिंग
12वस्तुओं के साथ उन्नत कार्य
या
C++ भाषा प्रशिक्षण, भाग 2
C++ पाठ्यक्रम का दूसरा भाग, जिसमें उन्नत विषयों और भाषा क्षमताओं को शामिल किया गया है।
01मल्टी-थ्रेडेड प्रोग्रामिंग। म्यूटेक्स और कंडीशन वेरिएबल्स का उपयोग करके थ्रेड्स को सिंक्रोनाइज़ करना।
02परमाणु चर। C++ मेमोरी मॉडल. लॉक-मुक्त डेटा संरचनाओं के उदाहरण.
03C++ में उन्नत मेटा-प्रोग्रामिंग तकनीक। मेटाफ़ंक्शन, SFINAE, अवधारणाएँ।
04प्रतिस्पर्धी प्रोग्रामिंग, नेटवर्क के साथ बातचीत।
05llvm वास्तुकला। C++ पार्स ट्री के साथ कार्य करना। C++ कोड के विश्लेषण के लिए उपकरणों का विकास।
तीसरा सेमेस्टर
से चुनने के लिए
प्राकृतिक भाषा प्रसंस्करण
“एनएलपी (प्राकृतिक भाषा प्रसंस्करण) एआई के व्यापक क्षेत्र का एक उपसमूह है जो कंप्यूटर को प्राकृतिक भाषा में कच्चे डेटा को समझने और संसाधित करने के लिए सिखाने का प्रयास करता है। आज उपलब्ध अधिकांश जानकारी संरचित पाठ नहीं है। बेशक, मनुष्य के रूप में, हमारे लिए उन्हें समझना मुश्किल नहीं है (यदि वे हमारी मूल भाषा में हैं), लेकिन हम उतना डेटा संसाधित करने में सक्षम नहीं हैं जितना एक मशीन संसाधित कर सकती है। लेकिन आप किसी मशीन को इस डेटा को कैसे समझा सकते हैं और इसके अलावा, इससे कुछ जानकारी कैसे निकाल सकते हैं? कई साल पहले, एसीएल के उद्घाटन पर (यदि सबसे महत्वपूर्ण एनएलपी सम्मेलन नहीं तो मुख्य में से एक)। अध्यक्षीय भाषण मार्टी हर्स्ट ने स्वीकार किया कि वह अब छात्रों को अपना पसंदीदा नहीं दे सकतीं व्यायाम। एक उदाहरण के रूप में एचएएल 9000 (विज्ञान कथा में कृत्रिम बुद्धिमत्ता के उदाहरणों में से एक) का उपयोग करते हुए, उन्होंने छात्रों से पूछा कि मशीन एचएएल की तरह क्या कर सकती है और यह अभी तक क्या नहीं कर सकती है। आजकल यह उतना अच्छा व्यायाम नहीं रह गया है, क्योंकि अब लगभग यह सब कंप्यूटर द्वारा किया जा सकता है। यह आश्चर्यजनक है कि यह क्षेत्र कितनी तेजी से बढ़ रहा है और हमने कितना कुछ हासिल किया है। पाठ्यक्रम में हम आपको यह समझाने और महसूस कराने का प्रयास करेंगे कि दुनिया में क्या हो रहा है। किन समस्याओं का समाधान होता है, यह कैसे होता है; कैसे कुछ सांख्यिकीय दृष्टिकोण (कुछ साल पहले एनएलपी पर कौन से पाठ्यक्रम लगभग पूरी तरह से समर्पित थे) तंत्रिका नेटवर्क में एक नया जीवन और नई व्याख्या प्राप्त करते हैं, और कौन से दृष्टिकोण धीरे-धीरे समाप्त हो जाते हैं। हम दिखाएंगे कि एनएलपी जोड़ियों (समस्या, समाधान) का एक सेट नहीं है, बल्कि सामान्य विचार हैं जो विभिन्न समस्याओं में प्रवेश करते हैं और कुछ सामान्य अवधारणा को दर्शाते हैं। आप यह भी सीखेंगे कि व्यवहार में क्या होता है और कब कौन सा दृष्टिकोण अधिक लागू होता है। हम यही करते हैं, जो हमें पसंद है, और हम इसे आपके साथ साझा करने के लिए तैयार हैं :)"
01 https://lena-voita.github.io/nlp_course.html
02 https://github.com/yandexdataschool/nlp_course
या
कंप्यूटर दृष्टि
"पाठ्यक्रम कंप्यूटर विज़न के तरीकों और एल्गोरिदम के लिए समर्पित है, यानी छवियों और वीडियो से जानकारी निकालना। आइए छवि प्रसंस्करण, छवि वर्गीकरण, सामग्री द्वारा छवि खोज, चेहरे की पहचान, छवि विभाजन की मूल बातें देखें। फिर हम वीडियो प्रोसेसिंग और विश्लेषण एल्गोरिदम के बारे में बात करेंगे। पाठ्यक्रम का अंतिम भाग 3डी पुनर्निर्माण के लिए समर्पित है। अधिकांश समस्याओं के लिए हम मौजूदा तंत्रिका नेटवर्क मॉडल पर चर्चा करेंगे। पाठ्यक्रम में हम केवल सबसे आधुनिक तरीकों पर ध्यान देने का प्रयास करते हैं जो वर्तमान में व्यावहारिक और अनुसंधान समस्याओं को हल करने में उपयोग किए जाते हैं। यह पाठ्यक्रम सैद्धांतिक के बजाय काफी हद तक व्यावहारिक है। इसलिए, सभी व्याख्यान प्रयोगशाला और होमवर्क से सुसज्जित हैं, जो आपको अभ्यास में चर्चा की गई अधिकांश विधियों को आज़माने की अनुमति देते हैं। यह कार्य विभिन्न पुस्तकालयों का उपयोग करके पायथन में किया जाता है।"
01डिजिटल इमेजिंग और टोन सुधार
02छवि प्रसंस्करण की मूल बातें
03छवि सिलाई
04छवि वर्गीकरण और समान छवियों की खोज करें
05समान छवियों के वर्गीकरण और खोज के लिए संवादात्मक तंत्रिका नेटवर्क
06वस्तु का पता लगाना
07शब्दार्थ विभाजन
08शैली स्थानांतरण और छवि संश्लेषण
09वीडियो पहचान
10विरल 3डी पुनर्निर्माण
11सघन 3डी पुनर्निर्माण
12 एक फ्रेम और बिंदु बादलों से पुनर्निर्माण, पैरामीट्रिक मॉडल
या
मशीन लर्निंग में बायेसियन विधियाँ
01 संभाव्यता सिद्धांत के लिए बायेसियन दृष्टिकोण
02विश्लेषणात्मक बायेसियन अनुमान
03बायेसियन मॉडल चयन
04प्रासंगिकता का स्वचालित निर्धारण
05 वर्गीकरण समस्या के लिए प्रासंगिकता वेक्टर विधि
06अव्यक्त चर के साथ संभाव्य मॉडल
07वैरिएशनल बायेसियन अनुमान
08गाऊसियन का बायेसियन मिश्रण पृथक्करण मॉडल
09मार्कोव श्रृंखलाओं के साथ मोंटे कार्लो विधियाँ
10अव्यक्त डिरिचलेट आवंटन
11 प्रतिगमन और वर्गीकरण के लिए गॉसियन प्रक्रियाएं
12 नॉनपैरामीट्रिक बायेसियन विधियाँ
चौथा सेमेस्टर
अनिवार्य
एमएल इंजीनियरिंग प्रैक्टिस
यह पाठ्यक्रम टीमों में एमएल प्रोजेक्ट विकसित करने पर प्रोजेक्ट कार्य है।
एमएल अनुसंधान अभ्यास
यह पाठ्यक्रम मशीन लर्निंग के क्षेत्र में टीम अनुसंधान परियोजनाओं पर काम का प्रतिनिधित्व करता है।
अनुशंसित विशेष पाठ्यक्रम
ध्यान लगा के पढ़ना या सीखना
01पाठ्यक्रम सामग्री
सुदृढीकरण सीखना
01पाठ्यक्रम सामग्री
सेल्फ ड्राइविंग कारें
पाठ्यक्रम में सेल्फ-ड्राइविंग तकनीक के मुख्य घटकों को शामिल किया गया है: स्थानीयकरण, धारणा, भविष्यवाणी, व्यवहार स्तर और गति योजना। प्रत्येक घटक के लिए, मुख्य दृष्टिकोणों का वर्णन किया जाएगा। इसके अतिरिक्त, छात्र मौजूदा बाजार स्थितियों और तकनीकी चुनौतियों से परिचित होंगे।
01मानवरहित वाहन के मुख्य घटकों और सेंसर का अवलोकन। स्वायत्तता के स्तर. ड्राइव बाय वायर। एक व्यावसायिक उत्पाद के रूप में स्व-चालित कारें। ड्रोन बनाने में प्रगति का मूल्यांकन करने के तरीके। स्थानीयकरण की मूल बातें: जीएनएसएस, व्हील ओडोमेट्री, बायेसियन फिल्टर।
02लिडार स्थानीयकरण विधियाँ: ICP, NDT, LOAM। उदाहरण के तौर पर ORB-SLAM का उपयोग करके विज़ुअल SLAM का परिचय। ग्राफ़स्लैम समस्या का विवरण। ग्राफ़स्लैम समस्या को एक अरेखीय न्यूनतम वर्ग विधि में कम करना। सही मानकीकरण का चयन करना। ग्राफ़स्लैम में एक विशेष संरचना वाले सिस्टम। वास्तुशिल्प दृष्टिकोण: फ्रंटएंड और बैकएंड।
03स्वचालित कार में पहचान कार्य। स्थैतिक और गतिशील बाधाएँ। पहचान प्रणाली के लिए सेंसर. स्थैतिक बाधाओं का प्रतिनिधित्व. लिडार (VSCAN, तंत्रिका नेटवर्क विधियों) का उपयोग करके स्थैतिक बाधाओं का पता लगाना। स्टैटिक्स (सिमेंटिक छवि विभाजन, गहराई पूर्णता) का पता लगाने के लिए छवियों के साथ संयोजन में लिडार का उपयोग करना। स्टीरियो कैमरा और तस्वीर से गहराई प्राप्त करना। स्टिक्सल वर्ल्ड।
04स्वचालित कार में गतिशील बाधाओं का प्रतिनिधित्व। 2डी में वस्तुओं का पता लगाने के लिए तंत्रिका नेटवर्क विधियां। लिडार क्लाउड प्रतिनिधित्व के विहंगम दृश्य पर आधारित पता लगाना। गतिशील बाधाओं का पता लगाने के लिए इमेजरी के साथ लिडार का उपयोग करना। चित्रों के आधार पर 3डी में कार का पता लगाना (3डी बॉक्स फिटिंग, सीएडी मॉडल)। रडार-आधारित गतिशील बाधा का पता लगाना। वस्तु ट्रैकिंग.
05कार ड्राइविंग पैटर्न: पिछला पहिया, अगला पहिया। पथ योजना. कॉन्फ़िगरेशन स्थान की अवधारणा. प्रक्षेपपथ के निर्माण के लिए ग्राफ़ विधियाँ। प्रक्षेप पथ जो झटके को न्यूनतम करते हैं। प्रक्षेप पथ के निर्माण के लिए अनुकूलन विधियाँ।
06 गतिशील वातावरण में गति योजना। एसटी योजना. अन्य सड़क उपयोगकर्ताओं के व्यवहार की भविष्यवाणी करना
न्यूरो-बायेसियन विधियाँ
यह पाठ्यक्रम गहन शिक्षण में बायेसियन विधियों के अनुप्रयोग पर केंद्रित है। व्याख्यान जेनरेटर डेटा मॉडल बनाने के लिए संभाव्य मॉडलिंग के उपयोग, प्रतिस्पर्धा के उपयोग के बारे में बात करेंगे अनुमानित अनुमान के लिए नेटवर्क, तंत्रिका नेटवर्क मापदंडों में मॉडलिंग अनिश्चितता, और गहराई में कुछ खुली समस्याएं प्रशिक्षण।
01स्टोकेस्टिक वैरिएबल अनुमान
02दोगुना स्टोकेस्टिक परिवर्तनशील अनुमान
03वेरिएशनल ऑटोएनकोडर, वेरिएशनल अनुमान के लिए प्रवाह को सामान्य बनाता है
04अव्यक्त चर मॉडल में भिन्नता को कम करने के तरीके
05वितरण घनत्व के अनुपात का अनुमान, \alpha-GAN के उदाहरण का उपयोग करके अनुप्रयोग
06बायेसियन तंत्रिका नेटवर्क
07 तंत्रिका नेटवर्क का बायेसियन संपीड़न
08अर्ध-अंतर्निहित परिवर्तनशील अनुमान