NVIDIA ने विवरण द्वारा वीडियो बनाने के लिए एक तंत्रिका नेटवर्क पेश किया
अनेक वस्तुओं का संग्रह / / April 20, 2023
यदि आप एक इम्पीरियल स्टॉर्मट्रूपर को समुद्र तट पर खाली देखना चाहते हैं।
एनवीडिया कंपनी की घोषणा की एक नया VideoLDM AI मॉडल जो टेक्स्ट के आधार पर लघु वीडियो बनाता है। इसे कॉर्नेल यूनिवर्सिटी के शोधकर्ताओं के सहयोग से विकसित किया गया था।
VideoLDM 4.1 बिलियन मापदंडों को ध्यान में रखता है, जिनमें से 2.7 बिलियन को वीडियो पर प्रशिक्षित किया जाता है। जेनरेट की गई क्लिप 24 फ़्रेमों पर 2048×1280 पिक्सेल तक हो सकती हैं और इसकी अवधि 4.7 सेकंड तक हो सकती है।
तंत्रिका नेटवर्क अनुरोध में कुछ शब्दों के साथ सरल दृश्य और कुछ अधिक जटिल दोनों बनाने में सक्षम है। कुछ उदाहरण:
- आतिशबाजी।
- एक तूफानी समुद्र तट को खाली कर रहा है।
- एक यात्री सूर्यास्त के समय धुंधले जंगल में अकेला चलता है।
अधिक उदाहरण चालू हैं परियोजना वेबसाइट.
यह NVIDIA तंत्रिका नेटवर्क अभी सार्वजनिक डोमेन में नहीं है। यह मशीन विजन और पैटर्न पहचान पर सम्मेलन के ढांचे के भीतर एक शोध पत्र के रूप में प्रस्तुत किया गया था।
डेवलपर्स ने सीखने में प्रभावशाली और तीव्र प्रगति का उल्लेख किया, लेकिन तंत्रिका नेटवर्क के संभावित भविष्य के बारे में बात नहीं की। फिर भी, हम यह मान सकते हैं कि जल्द ही हमें एक पूर्ण वीडियो एनालॉग मिलेगा मध्य यात्रा.
यह भी पढ़ें🧐
- वीडियो निर्माण के लिए 10 तंत्रिका नेटवर्क सेवाएं
- वीडियो की गुणवत्ता में सुधार के लिए 7 तंत्रिका नेटवर्क उपकरण
- टेक्स्ट डिस्क्रिप्शन से वीडियो बनाने के लिए रनवे ने एक नया न्यूरल नेटवर्क मॉडल लॉन्च किया