नया स्थिर ऑडियो न्यूरल नेटवर्क पाठ विवरण के आधार पर संगीत उत्पन्न करता है
अनेक वस्तुओं का संग्रह / / September 14, 2023
स्थिर प्रसार के रचनाकारों से।
स्थिरता एआई, मुख्य रूप से चित्र उत्पन्न करने के लिए तंत्रिका नेटवर्क के लिए जाना जाता है (स्थिर प्रसार, स्थिर डूडल और न केवल), जारी किया नया तंत्रिका नेटवर्क स्थिर ऑडियो। जैसा कि नाम से पता चलता है, यह ऑडियो क्लिप जेनरेट करता है।
सब कुछ लगभग उसी तरह से काम करता है जैसे पाठ विवरण के आधार पर छवि जनरेटर। उपयोगकर्ता कीवर्ड निर्दिष्ट करता है (उदाहरण के लिए, "मेलोडिक लो-फाई हिप-हॉप, मेलोडिक, 85 बीपीएम" या "शक्तिशाली गिटार रिफ़ और तेज़ ड्रम के साथ डेथ मेटल"), वांछित अवधि और परिणाम की प्रतीक्षा करता है।
हमने आधार के रूप में स्टेबल डिफ्यूज़न के समान मॉडल का उपयोग किया, लेकिन इसे छवियों के बजाय संगीत रचनाओं पर प्रशिक्षित किया। कुल मिलाकर, उसे स्टॉक म्यूजिक साइट ऑडियोस्पार्क्स से लगभग 800 हजार ट्रैक - या लगभग 19,500 घंटे की विभिन्न ध्वनियाँ खिलाई गईं।
रचनाकारों ने ध्यान दिया कि स्थिर ऑडियो की मुख्य विशेषता एक निश्चित लंबाई की रचनाएँ उत्पन्न करने की क्षमता है। पहले, तंत्रिका नेटवर्क केवल एक निश्चित अवधि के साथ काम करते थे: यदि उन्हें 30-सेकंड ऑडियो क्लिप पर प्रशिक्षित किया जाता था, तो वे केवल 30-सेकंड की रचनाएँ उत्पन्न कर सकते थे। किसी ट्रैक की अवधि को समायोजित करने में सक्षम होने के लिए, डेवलपर्स को मॉडल बदलना पड़ा और रचना की शुरुआत और अंत के लिए मेटाडेटा जोड़ना पड़ा।
स्थिर ऑडियो तीन मॉडलों में पेश किया गया है। निःशुल्क संस्करण आपको प्रति माह 45 सेकंड तक चलने वाले 20 से अधिक गाने उत्पन्न करने की अनुमति नहीं देता है। एक व्यावसायिक सदस्यता भी है जो आपको $12 प्रति के हिसाब से 90 सेकंड तक के 500 ट्रैक बनाने की सुविधा देती है। माह (≈1,200 रूबल) और व्यक्तिगत रूप से उत्पादन की मात्रा और कीमत का चयन करने की क्षमता वाली कंपनियों के लिए एंटरप्राइज़ विकल्प ठीक है। आप सशुल्क सदस्यता के बिना व्यावसायिक उद्देश्यों के लिए उत्पन्न संगीत का उपयोग नहीं कर सकते।
अन्य समान तंत्रिका नेटवर्क की तरह, स्टेबल ऑडियो का उद्देश्य पेशेवर संगीतकारों की तुलना में सामग्री रचनाकारों पर अधिक है। जब आपके पास किसी संगीतकार के साथ सहयोग करने के लिए समय या बजट नहीं होता है तो ऐसे उपकरण पॉडकास्ट और वीडियो के लिए तुरंत पृष्ठभूमि संगीत बनाने के लिए उपयुक्त होते हैं। यदि आप अनोखी हंसी या भीड़ का शोर चाहते हैं तो यह स्टॉक ध्वनियों की जगह भी ले सकता है।
आप आधिकारिक वेबसाइट पर स्थिर ऑडियो आज़मा सकते हैं। आपको Google खाते से पंजीकरण या लॉग इन करना होगा। शुरुआत में सर्वर पर भारी लोड के कारण पहुंच में रुकावट आ सकती है।
स्थिर ऑडियो →
अधिक नए तंत्रिका नेटवर्क🦾✨
- Sber का AIDA वर्चुअल असिस्टेंट मॉस्को क्लीनिक में मरीजों का निदान करेगा
- नया ऐप Artisse उपयोगकर्ता के चेहरे के साथ शानदार तस्वीरें तैयार करता है
- स्टेबिलिटी एआई ने चैटबॉट स्टेबल चैट पेश किया - जो चैटजीपीटी का एक मुफ्त एनालॉग है