पाठ्यक्रम "डेटा विज्ञान विशेषज्ञ" - पाठ्यक्रम 112,000 रूबल। यांडेक्स वर्कशॉप से, प्रशिक्षण 8 महीने, दिनांक 30 नवंबर, 2023।
अनेक वस्तुओं का संग्रह / / November 28, 2023
डेटा वैज्ञानिक क्या करते हैं?
बड़ी मात्रा में डेटा का विश्लेषण करें, मॉडल विकसित करें और भविष्यवाणियां करने और पैटर्न की पहचान करने के लिए मशीन लर्निंग लागू करें। इनकी आवश्यकता विभिन्न क्षेत्रों में होती है जहां डेटा को संग्रहीत और संसाधित करने की आवश्यकता होती है।
बैंकों में
ग्राहकों के बारे में डेटा का विश्लेषण करें और निर्धारित करें कि कौन से संकेतक उनकी साख को प्रभावित करते हैं, ग्राहक के बैंक छोड़ने की संभावना का अनुमान लगाएं
उद्योग में
मशीन लर्निंग का उपयोग करते हुए, वे भविष्यवाणी करते हैं कि उपकरण कब विफल होंगे और किस जमा खनन में सबसे अधिक लाभ होगा।
विपणन और वाणिज्य में
वे मौसमी, चरम बिक्री के दिनों का विश्लेषण करके और एक अनुशंसा प्रणाली बनाकर विकास बिंदु खोजने में मदद करते हैं
परिवहन क्षेत्र में
ट्रैफिक लाइटों के संचालन को अनुकूलित करें, सड़कों पर भार का आकलन करें और मरम्मत योजनाओं को समायोजित करने में मदद करें
डेटा विज्ञान में संपूर्ण पाठ्यक्रम कार्यक्रम
हम इसे नियमित रूप से अपडेट करते हैं ताकि यह सुनिश्चित हो सके कि यह उद्योग और नियोक्ता की जरूरतों को पूरा करता है। दूसरे शब्दों में, आप वही सीखते हैं जो निश्चित रूप से आपके काम में उपयोगी होगा।
पायथन और डेटा विश्लेषण की मूल बातें: निःशुल्क परिचयात्मक पाठ्यक्रम:
डेटा विश्लेषण की बुनियादी अवधारणाओं को जानें और समझें कि डेटा विश्लेषक और डेटा वैज्ञानिक क्या करते हैं। विभिन्न क्षेत्रों के डेटा के साथ काम करने के पाँच मामले हल करें:
- गैजेट्स के बड़े पैमाने पर खराब होने का कारण पता करें,
- मोबाइल एप्लिकेशन विज्ञापन का भुगतान जांचें,
- नए स्टोर के लिए सर्वोत्तम स्थान ढूंढें,
- एआई स्टार्टअप के लिए विकास रणनीति चुनने में आपकी सहायता करें,
- सहायता सेवा में रोबोट की प्रभावशीलता का मूल्यांकन करें।
मामलों को हल करके, आप पायथन और पांडा लाइब्रेरी की मूल बातें सीखेंगे, कुछ ग्राफ़ बनाना और उनकी सही व्याख्या करना सीखेंगे।
पेशे का परिचय "डेटा विज्ञान विशेषज्ञ"
डेटा विज्ञान विशेषज्ञ क्या है?
हम कैसे पढ़ाते हैं.
बुनियादी पायथन:
पायथन प्रोग्रामिंग भाषा और पांडा लाइब्रेरी के बारे में गहराई से जानें।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
यांडेक्स उपयोगकर्ता डेटा की तुलना करें। शहर और सप्ताह के दिन के अनुसार संगीत।
डेटा प्रीप्रोसेसिंग:
आउटलेर्स, चूक और डुप्लिकेट से डेटा साफ़ करना सीखें, साथ ही विभिन्न डेटा प्रारूपों को परिवर्तित करना भी सीखें।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
बैंक ग्राहकों के बारे में डेटा का विश्लेषण करें और क्रेडिट योग्य ग्राहकों की हिस्सेदारी निर्धारित करें।
अन्वेषणात्मक डेटा विश्लेषण:
संभाव्यता और सांख्यिकी की मूल बातें जानें। डेटा के मूल गुणों का पता लगाने, पैटर्न, वितरण और विसंगतियों की तलाश के लिए उनका उपयोग करें। scipy और matplotlib लाइब्रेरी के बारे में जानें। चित्र बनाएं और ग्राफ़ का विश्लेषण करने का अभ्यास करें।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
सेंट पीटर्सबर्ग और लेनिनग्राद क्षेत्र में अचल संपत्ति की बिक्री के लिए विज्ञापनों के संग्रह का अन्वेषण करें।
सिद्धांत संभावना। अतिरिक्त पाठ्यक्रम
संभाव्यता सिद्धांत में मूल शब्दों को याद रखें या पहचानें: स्वतंत्र, विपरीत, असंगत घटनाएँ, आदि। सरल उदाहरणों और मज़ेदार समस्याओं का उपयोग करके, आप संख्याओं के साथ काम करने और समाधान के तर्क का निर्माण करने का अभ्यास करेंगे।
यह एक वैकल्पिक स्प्रिंट है. इसका मतलब यह है कि प्रत्येक छात्र स्वयं इनमें से एक विकल्प चुनता है:
- दस छोटे पाठों का एक अतिरिक्त पाठ्यक्रम लें, सिद्धांत पर ध्यान दें और समस्याओं का समाधान करें।
- केवल साक्षात्कार कार्यों वाला ब्लॉक खोलें, बिना सिद्धांत के अभ्यास याद रखें।
- समय और आवश्यकता होने पर पाठ्यक्रम को पूरी तरह छोड़ दें या उस पर वापस लौट आएं।
पहले मॉड्यूल का अंतिम प्रोजेक्ट
जानें कि प्रारंभिक डेटा अनुसंधान कैसे करें और परिकल्पनाएँ कैसे तैयार और परीक्षण करें।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
ऐसे पैटर्न ढूंढें जो गेम की सफलता निर्धारित करते हैं।
मशीन लर्निंग का परिचय:
बुनियादी मशीन सीखने की अवधारणाओं में महारत हासिल करें। स्किकिट-लर्न लाइब्रेरी को जानें और अपना पहला मशीन लर्निंग प्रोजेक्ट बनाने के लिए इसका उपयोग करें।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
मोबाइल ऑपरेटर के लिए टैरिफ अनुशंसा प्रणाली विकसित करें।
प्रशिक्षित प्रशिक्षण:
मशीन लर्निंग के सबसे गर्म क्षेत्र में गहराई से उतरें: पर्यवेक्षित शिक्षण। जानें कि असंतुलित डेटा से कैसे निपटें।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
किसी ग्राहक के बैंक छोड़ने की संभावना का अनुमान लगाएं।
व्यवसाय में मशीन लर्निंग:
जानें कि मशीन लर्निंग कैसे होती है (abbr. एमओ) व्यवसाय को डेटा एकत्र करने और उत्पाद मेट्रिक्स एमओ मेट्रिक्स से कैसे संबंधित है, इस पर मदद करता है। एमएल का उपयोग करके नई सेवा कार्यक्षमता लॉन्च करना सीखें। जानें कि बिजनेस मेट्रिक्स, KPI और A/B परीक्षण क्या हैं।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
एक मॉडल को प्रशिक्षित करें जो नुकसान के कम से कम जोखिम के साथ तेल उत्पादन के लिए एक नए स्थान की पहचान करने में मदद करता है।
दूसरे मॉड्यूल की अंतिम परियोजना:
मशीन लर्निंग के लिए डेटा तैयार करें। मॉडल का उपयोग करके उसकी गुणवत्ता का मूल्यांकन करें।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
उद्यम के संचालन में सुधार के लिए सोने के अयस्क को गलाने की प्रक्रिया का अनुकरण करें।
लीनियर अलजेब्रा:
अब तक सीखे गए कुछ एल्गोरिदम पर नज़र डालें और उनका उपयोग करने के तरीके की बेहतर समझ हासिल करें। व्यवहार में, शुरुआत से रैखिक बीजगणित की मुख्य अवधारणाओं में महारत हासिल करें: रैखिक रिक्त स्थान, रैखिक ऑपरेटर, यूक्लिडियन रिक्त स्थान।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
बीमा कंपनी के ग्राहकों की व्यक्तिगत जानकारी की सुरक्षा के लिए डेटा रूपांतरण पद्धति का उपयोग करें।
संख्यात्मक तरीके:
आप कई एल्गोरिदम का विश्लेषण करेंगे और संख्यात्मक तरीकों का उपयोग करके व्यावहारिक समस्याओं को हल करने के लिए उन्हें अनुकूलित करेंगे। अनुमानित गणना, एल्गोरिदम जटिलता अनुमान और ग्रेडिएंट डिसेंट में महारत हासिल करें। जानें कि तंत्रिका नेटवर्क को कैसे प्रशिक्षित किया जाता है और ग्रेडिएंट बूस्टिंग क्या है।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
प्रयुक्त कार की कीमत निर्धारित करने के लिए एक मॉडल विकसित करें।
समय श्रृंखला:
समय श्रृंखला बताती है कि बिजली की खपत या टैक्सी ऑर्डर की संख्या जैसे पैरामीटर समय के साथ कैसे बदलते हैं। आप श्रृंखला का विश्लेषण करना, रुझान देखना और मौसमी पहचान करना सीखेंगे। सारणीबद्ध डेटा और समय श्रृंखला प्रतिगमन समस्या बनाना सीखें।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
एक मॉडल बनाएं और चरम टैक्सी भार की भविष्यवाणी करें।
टेक्स्ट के लिए मशीन लर्निंग:
पाठों से संख्यात्मक वेक्टर बनाना सीखें और उनके लिए वर्गीकरण और प्रतिगमन समस्याओं को हल करें। जानें कि TF-IDF सुविधाओं की गणना कैसे की जाती है और Word2vec और BERT भाषा प्रतिनिधित्व से परिचित हों।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
विषाक्तता आकलन को स्वचालित करके अपने समुदाय में टिप्पणी मॉडरेशन को तेज़ करें।
बुनियादी एसक्यूएल:
डेटाबेस के साथ काम करने के लिए SQL क्वेरी भाषा और संबंधपरक बीजगणित की मूल बातें सीखें। एक लोकप्रिय डेटाबेस प्रबंधन प्रणाली (एबीबीआर) PostgreSQL में काम करने की सुविधाओं से परिचित हों। डीबीएमएस)। जटिलता के विभिन्न स्तरों की क्वेरीज़ लिखना सीखें और व्यावसायिक समस्याओं का SQL में अनुवाद करें।
आप एक ऑनलाइन स्टोर के डेटाबेस के साथ काम करेंगे जो फिल्मों और संगीत में विशेषज्ञता रखता है।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
एक डेटाबेस में अलग-अलग जटिलता के प्रश्नों की एक श्रृंखला लिखें जो उद्यम निवेशकों, स्टार्टअप और उनमें निवेश पर डेटा संग्रहीत करता है।
कंप्यूटर दृष्टि:
तैयार तंत्रिका नेटवर्क और केरस लाइब्रेरी का उपयोग करके सरल कंप्यूटर दृष्टि समस्याओं को हल करना सीखें। गहन शिक्षा को जानें।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
किसी तस्वीर से किसी व्यक्ति की अनुमानित आयु निर्धारित करने के लिए एक मॉडल बनाएं।
बिना पर्यवेक्षण के सीखना:
अनसुपरवाइज्ड लर्निंग मशीन लर्निंग के तरीकों में से एक है जिसमें सिस्टम अपनी विशेषताओं और संरचना के आधार पर पूर्व-लेबल डेटा के बिना किसी समस्या का समाधान करता है। क्लस्टरिंग और विसंगति का पता लगाने की समस्याओं के बारे में जानें।
स्नातक परियोजना:
अंतिम प्रोजेक्ट में, पुष्टि करें कि आपने एक नए पेशे में महारत हासिल कर ली है। ग्राहक के कार्य को स्पष्ट करें और डेटा विश्लेषण और मशीन लर्निंग के सभी चरणों से गुजरें। अब कोई पाठ या होमवर्क नहीं है - सब कुछ वास्तविक नौकरी जैसा है।
पोर्टफ़ोलियो में +1 प्रोजेक्ट
चुनने के लिए प्रोजेक्ट:
- एक ऐसा मॉडल बनाएं जो किसी दूरसंचार कंपनी से ग्राहक मंथन की भविष्यवाणी करता हो।
- एक ऐसा मॉडल बनाएं जो धातुकर्म संयंत्र में तकनीकी प्रक्रिया के मापदंडों की भविष्यवाणी करता हो।
डी
दरियामानन्निकोवा
01.10.2020 जी।
आदर्श ऑनलाइन पाठ्यक्रमों का उदाहरण
यांडेक्स में। कार्यशाला के दौरान, मैं डेटासाइंस के पेशे का अध्ययन कर रहा हूं, जो अब काफी फैशनेबल दिशा है, और जैसा कि यह निकला, यह काफी कठिन है, जैसा कि वे कहते हैं, सीखना कठिन है - लड़ना आसान है। (adsbygoogle = window.adsbygoogle || []).push({}); मेरे रास्ते में कई कठिनाइयाँ थीं, मेरे पास पर्याप्त समय नहीं था (मैं अपना डिप्लोमा ले रहा था और काम कर रहा था), आंकड़ों को समझने की ताकत समय-समय पर मुझसे छूटती गई, कोरोनोवायरस ने हम सभी को घर पर बंद कर दिया...
एस
सर्जेन355
14.07.2021 जी।
महान शैक्षिक परियोजना
लाभ: स्वयं का सिम्युलेटर, परियोजना समीक्षा, परामर्श, स्लैक में समुदाय, हर मुद्दे पर मदद। नुकसान: एकमात्र नकारात्मक यह है कि कुछ विषयों में सिम्युलेटर में पूरी सामग्री नहीं है; जानकारी को स्वतंत्र रूप से खोजने के लिए अतिरिक्त समय की आवश्यकता होती है। मैंने डेटा साइंस संकाय में अध्ययन किया। अच्छा प्रशिक्षण प्रारूप. कुछ अंदर आते हैं, कुछ नहीं आते। लेकिन मेरे लिए, यह अधिकतम है...