व्यवहार में मशीन लर्निंग - पाठ्यक्रम 41,500 रूबल। IBS प्रशिक्षण केंद्र से, 24 घंटे प्रशिक्षण, दिनांक 26 नवंबर, 2023।
अनेक वस्तुओं का संग्रह / / December 02, 2023
पाठ्यक्रम कई व्यावहारिक मामलों के आधार पर बनाया गया है जिसमें प्रारंभिक डेटा वाली तालिकाएँ शामिल हैं।
प्रत्येक मामले के लिए, हम मशीन लर्निंग प्रोजेक्ट के पूर्ण जीवन चक्र से गुजरते हैं:
अनुसंधान, सफाई और डेटा की तैयारी,
कार्य के लिए उपयुक्त प्रशिक्षण विधि चुनना (प्रतिगमन के लिए रैखिक प्रतिगमन, वर्गीकरण के लिए यादृच्छिक वन, K- साधन और क्लस्टरिंग के लिए DBSCAN),
चुनी गई विधि का उपयोग करके प्रशिक्षण,
परिणाम मूल्यांकन,
मॉडल अनुकूलन,
ग्राहक को परिणाम की प्रस्तुति।
पाठ्यक्रम के चर्चा भाग के दौरान, हम छात्रों के सामने आने वाली व्यावहारिक समस्याओं पर चर्चा करते हैं जिन्हें चर्चा की गई विधियों का उपयोग करके हल किया जा सकता है।
शामिल विषय:
1. कार्य की समीक्षा (सिद्धांत - 1 घंटा)
मशीन लर्निंग द्वारा किन समस्याओं को अच्छी तरह से हल किया जाता है, और वे किन समस्याओं को हल करने का प्रयास कर रहे हैं?
यदि डेटा वैज्ञानिक के बजाय, आप क्षेत्र में एक गैर-विशेषज्ञ (सिर्फ एक डेवलपर/विश्लेषक/प्रबंधक) को इस उम्मीद के साथ नियुक्त करते हैं कि वे इस प्रक्रिया में सीखेंगे तो क्या होगा।
2. तैयारी, सफाई, डेटा अनुसंधान (सिद्धांत - 1 घंटा, अभ्यास - 1 घंटा)
स्रोत व्यवसाय डेटा को कैसे समझें (और आम तौर पर इसमें किसी भी ऑर्डर का पता लगाएं)।
प्रसंस्करण का क्रम.
डोमेन विश्लेषकों को क्या सौंपा जा सकता है और क्या सौंपा जाना चाहिए, और डेटा वैज्ञानिक द्वारा स्वयं क्या करना सबसे अच्छा है।
किसी विशिष्ट समस्या के समाधान के लिए प्राथमिकताएँ।
3. क्लासिफायर और रिग्रेसर (सिद्धांत - 2 घंटे, अभ्यास - 2 घंटे)
व्यावहारिक अनुभाग - तैयार डेटा के साथ अच्छी तरह से औपचारिक कार्य।
कार्यों के बीच अंतर (बाइनरी/गैर-बाइनरी/संभाव्य वर्गीकरण, प्रतिगमन), वर्गों के बीच कार्यों का पुनर्वितरण।
व्यावहारिक समस्याओं के वर्गीकरण के उदाहरण.
4. क्लस्टरिंग (सिद्धांत - 1 घंटा, अभ्यास - 2 घंटे)
क्लस्टरिंग कहाँ और कैसे करें: डेटा अनुसंधान, समस्या कथन की जाँच करना, परिणामों की जाँच करना।
किन मामलों को क्लस्टरिंग में घटाया जा सकता है.
5. मॉडल मूल्यांकन (सिद्धांत - 1 घंटा, अभ्यास - 1 घंटा)
बिजनेस मेट्रिक्स और तकनीकी मेट्रिक्स।
वर्गीकरण और प्रतिगमन समस्याओं के लिए मेट्रिक्स, त्रुटि मैट्रिक्स।
क्लस्टरिंग गुणवत्ता के आंतरिक और बाह्य मेट्रिक्स।
पार सत्यापन।
पुनर्प्रशिक्षण का आकलन करना.
6. अनुकूलन (सिद्धांत - 5 घंटे, अभ्यास - 3 घंटे)
क्या चीज़ एक मॉडल को दूसरे से बेहतर बनाती है: पैरामीटर, सुविधाएँ, संयोजन।
सेटिंग्स प्रबंधन.
फ़ीचर चयन अभ्यास.
सर्वोत्तम मापदंडों, सुविधाओं और विधियों को खोजने के लिए उपकरणों की समीक्षा।
7. चार्ट, रिपोर्ट, लाइव कार्यों के साथ काम करना (सिद्धांत - 2 घंटे, अभ्यास - 2 घंटे)
जो हो रहा है उसे स्पष्ट रूप से कैसे समझाएं: अपने आप को, टीम को, ग्राहक को।
निरर्थक प्रश्नों के और भी सुन्दर उत्तर.
एक स्लाइड पर तीन टेराबाइट परिणाम कैसे प्रस्तुत करें।
अर्ध-स्वचालित परीक्षण, जो प्रक्रिया नियंत्रण बिंदुओं की वास्तव में आवश्यकता है।
लाइव कार्यों से लेकर पूर्ण आर एंड डी प्रक्रिया ("व्यवहार में आर एंड डी") तक - दर्शकों से कार्यों का विश्लेषण और विश्लेषण।