यांडेक्स ने तंत्रिका नेटवर्क को जटिल वर्तनी के साथ अभिलेखीय रिकॉर्ड को समझने के लिए सिखाया
अनेक वस्तुओं का संग्रह / / April 03, 2023
ऐतिहासिक पांडुलिपियां, जो किसी व्यक्ति के लिए पार्स करना मुश्किल हैं, लगभग तुरंत कृत्रिम बुद्धि द्वारा मुद्रित पाठ में परिवर्तित हो जाती हैं।
यांडेक्स ने आर्काइव सर्च नामक एक नई सेवा शुरू की है, जो जटिल पूर्व-क्रांतिकारी वर्तनी के साथ अभिलेखीय रिकॉर्ड को समझने के लिए तंत्रिका नेटवर्क का उपयोग करती है।
सेवा टेक्स्ट ट्रांसक्रिप्ट के साथ ऐतिहासिक दस्तावेज़ों के 2.5 मिलियन से अधिक पृष्ठों तक पहुंच प्रदान करती है। ऑप्टिकल कैरेक्टर रिकॉग्निशन सिस्टम के आधार पर बनाया गया इसका एल्गोरिदम, लिखावट की ख़ासियत को ध्यान में रखता है, उन अक्षरों को पहचानता है जो अपनी प्रासंगिकता खो चुके हैं और अभिलेखीय दस्तावेजों की विशेष संरचना को समझते हैं।
कंपनी के विशेषज्ञों ने तंत्रिका नेटवर्क को 18वीं-19वीं शताब्दी के वास्तविक ग्रंथों से सैकड़ों हजारों हस्तलिखित पंक्तियों और लाखों उत्पन्न उदाहरणों के डेटा सरणी पर प्रशिक्षित किया।
एक अप्रस्तुत व्यक्ति के लिए पांडुलिपियों को पार्स करना मुश्किल है, यैंडेक्स तकनीक लगभग तुरंत मुद्रित पाठ में बदल जाती है। इसके लिए धन्यवाद, सेवा के डेटाबेस में, आप अंतिम नाम, इलाके या किसी अन्य शब्द के उल्लेख के साथ दस्तावेजों को जल्दी से पा सकते हैं।
"अभिलेखागार में खोजें" इतिहासकारों, समाजशास्त्रियों, जनसांख्यिकी, वंशावली विज्ञानियों के काम की दक्षता में वृद्धि करेगा और उन लोगों की मदद करेगा जो अपने परिवार के बारे में जानकारी की तलाश कर रहे हैं।
सेवा में प्रस्तुत पहला कोष मास्को का मुख्य संग्रह था - यह इसकी सामग्री पर था कि डेवलपर्स ने तंत्रिका नेटवर्क को प्रशिक्षित किया। डेटाबेस में ऑरेनबर्ग और नोवगोरोड क्षेत्रों के अभिलेखागार से दस्तावेज़ भी शामिल हैं। समय के साथ, संग्रहण और उपलब्ध स्कैन की गई फ़ाइलों की संख्या में वृद्धि होगी।
आप 18वीं - 20वीं शताब्दी की सामग्रियों की खोज कर सकते हैं, जो उपयोगकर्ताओं के बीच सबसे लोकप्रिय हैं। ये पैरिश रजिस्टर, स्वीकारोक्ति पत्रक और जनसंख्या जनगणना के परिणामों के साथ संशोधन की कहानियाँ हैं। दस्तावेज़ कैटलॉग में या खोज बार के माध्यम से प्राप्त किए जा सकते हैं। वर्षों, अभिलेखागार, धन और सूची द्वारा फ़िल्टर हैं।
प्रत्येक पृष्ठ के स्कैन के आगे, तंत्रिका नेटवर्क द्वारा बनाई गई लाइन-बाय-लाइन डिकोडिंग प्रदर्शित होती है। यदि आप वांछित टुकड़े पर होवर करते हैं, तो यह तुरंत डिजिटल कॉपी पर हाइलाइट हो जाएगा।