ABBYY FineReader एक्सप्रेस 8.4: मक्खी पर किसी भी स्रोत से लेख को पहचानने (वितरण कोड पूरा)
Makradar प्रौद्योगिकी के / / December 19, 2019
डिजिटल सामग्री, और दस्तावेजों के इलेक्ट्रॉनिक संस्करण सभी पक्षों पर हमें चारों ओर। हमारे जीवन में कागज लगभग कोई जगह नहीं बची है। अखबारों और पत्रिकाओं पुस्तक हम ई-लिंक पाठक या टेबलेट पर पढ़ के ऑनलाइन प्रारूप में स्थानांतरित कर दिया, साधारण पत्र ईमेल और एसएमएस जगह ले ली है। फिर भी, कभी कभी हम उन्हें एक इलेक्ट्रॉनिक प्रतिलिपि प्राप्त करने के लिए पहले कागजात के साथ टिंकर करने के लिए है। यहाँ हम विशेष कार्यक्रम कि ओसीआर पाठ (ऑप्टिकल वर्ण पहचान) के लिए ओसीआर प्रौद्योगिकी का उपयोग करने की मदद के लिए आते हैं। इनमें से सबसे प्रसिद्ध निस्संदेह ABBYYFineReader है। आप इसका इस्तेमाल संपादन योग्य प्रारूपों में कागजी दस्तावेजों कन्वर्ट करने के लिए, और खोजने योग्य पाठ को पीडीएफ बचा सकता है। और आज हम इस बारे में अधिक जानने के लिए एक महान अवसर है।
* * *
Mac, ABBYY ऑफर केवल FineReader एक्सप्रेस के लिए, यह फिर भी आवश्यक कार्यक्षमता है। ABBYY FineReader एक्सप्रेस की प्रमुख विशेषताओं में से एक में तीन भाषाओं के लिए एक पहचान सटीकता और लेआउट प्रतिधारण, समर्थन कई भाषाओं के लिए (171 भाषा है दस्तावेज़), परिवर्तन और पीडीएफ (संपादन योग्य प्रारूपों के पीडीएफ रूपांतरण), मैनुअल अंकन क्षेत्रों (पाठ, तालिका, चित्र के लिए संपादक के निर्माण) और एक सरल, उपयोगकर्ता के अनुकूल इंटरफेस कार्यक्रम।
फर्स्ट लुक
FineReader एक्सप्रेस ऑपरेटिंग खिड़की केवल सबसे आवश्यक वस्तुओं वहाँ मौजूद काफी minimalistic है। साइड पैनल नमूने पृष्ठ जोड़ दिए और ड्रॉप-डाउन सूचियों के साथ isntrumentov पैनल बटन पर भाषा और आउटपुट फ़ाइल का चयन करने में शामिल है। अभी भी वहाँ रूपांतरण और ज़ूम बटन है। अन्यथा, एक तेजी से एक्सप्रेस संस्करण के लिए इंटरफ़ेस मेल खाती है, विन्यास और उपयोगकर्ता की भागीदारी की एक न्यूनतम के साथ आपरेशन का स्वत: निष्पादन पर जो शर्त।
परीक्षण पास
शुरू करने के बाद FineReader हमें परिदृश्य के विकल्प के साथ एक कॉम्पैक्ट खिड़की से मिलता है। स्कैनर, फैक्स, या एक फ़ाइल से पढ़ने: यहाँ हम पर कब्जा स्रोत का चयन करने के लिए कहा जाता है। यह भी एक दस्तावेज़ भाषा निर्दिष्ट करने के लिए सलाह दी जाती है (या भाषाएं, यदि एक से अधिक) - यह मूल दस्तावेज़ की मान्यता सटीकता में सुधार करने में मदद मिलेगी। ठीक है, वास्तव में आउटपुट फ़ाइल स्वरूप, सब कुछ सरल है - कागज दस्तावेज़ के प्रकार के आधार चुनें।
हाथ में स्कैनर मैं नहीं था, लेकिन यह और भी बेहतर है - के रूप में तस्वीर iPhone की मदद से बनाया का स्रोत है, मैं लेख पहचानने के लिए काम जटिल का उपयोग करते हुए। iPhone के कुछ पुराने काम कर रहे फिल्म खेप - पाठ का एक उदाहरण के रूप में, मैं अपनी पत्नी की पुस्तकों के साथ-साथ तालिका का एक उदाहरण में से एक ले लिया। ठीक है, आइए आरंभ करें।
पाठ के साथ प्रत्येक पृष्ठ
तस्वीर सामान्य कमरे में प्रकाश, कोई तिपाई, और अन्य तोड़ मरोड़ - एक स्कैनर की कमी के लिए मैं सिर्फ एक किताब बारी फ़ोटो किया था। यहाँ मूल है:
क्या यह FineReader साथ कर सकते हैं देखते हैं। हम निर्दिष्ट है कि हम, फ़ोटो पाठ बाहर खींच की तरह रूसी भाषा को परिभाषित है, और इस प्रक्रिया को शुरू करना चाहते हैं।
अपने क्रेडिट करने के लिए, आवेदन कहा जाना चाहिए कि पूरे पाठ गलती से सटे पेज मोड़ मिला सहित परिभाषित किया गया था। तालिका, जो मैं विशेष रूप से फ़्रेम में छोड़ दिया का एक टुकड़ा, उम्मीद चित्र के रूप में परिभाषित किया। लेकिन यह डरावना नहीं है, क्योंकि हम स्वयं, डोमेन बदल सकते हैं अपने प्रकार निर्दिष्ट (कार्यक्रम सही ढंग से सेट नहीं है) और फील्ड, मान्यता जिनमें से आवश्यक है हटा दें। सभी जोड़तोड़ मुझे एक मिनट से भी कम समय लिया, लेकिन अंत मैं यहाँ मिल गया में एक काफी स्वीकार्य परिणाम है:
एक छोटी प्रूफरीडिंग और संपादन करने के बाद दस्तावेज़ तैयार है। मुझे लगता है कि इस तरह के एक त्वरित, लगभग स्वचालित पहचान प्रक्रिया के लिए एक अच्छा परिणाम है।
तालिका को पहचान
एक प्रयोगात्मक तालिका सरल बिल, जो भी iPhone पर फिल्माया गया था में कार्य करता है के रूप में। वहाँ है, जो भी हमारे अनुभव के लिए अच्छा है (चेक भाषा समर्थन के साथ) में उपयोग के यूक्रेनी पहले से ही है। एक नई स्क्रिप्ट का चयन (⌘Nयूक्रेनी, और फ़ाइल आउटपुट - - एक फ़ाइल, भाषा से पढ़ा - टेबल) स्रोत का उल्लेख करें।
कार्यक्रम कुछ सेकंड के लिए सोचता है, और यहाँ हम परिणाम है:
साथ तालिका कार्यक्रम इतनी अच्छी तरह से संभाला नहीं है, लेकिन यह कम या ज्यादा स्वीकार्य है, सिद्धांत रूप में, परिभाषा के पाठ, जब तक कारण कोशिकाओं है कि मूल दस्तावेज में नहीं थे खत्म करने के लिए। नक्शे दस्तावेज़ के अंतिम रूप को पाने के लिए थोड़ी देर और टिंकर करने के लिए होगा, लेकिन यह खरोंच से हाथ से एक संकेत टाइपिंग की तुलना में आसान है।
पीडीएफ के लिए सहेजें
जब पीडीएफ करने के लिए बचत, कार्यक्रम दुर्भाग्य से मूल छवि (इसके विपरीत, चमक) में सुधार नहीं होता है और यह पीडीएफ-दस्तावेज में रखा जाता है के रूप में। लेकिन कम, खोज पाठ मौजूद है, और है कि के अच्छे।
परिणाम
किसी भी उपकरण की तरह, FineReader इसके पक्ष और विपक्ष है। मजबूत अंक, निर्माता के घोषित विशेषताओं के अलावा, कि ओसीआर है टेबल और काफी अच्छी तरह से काम करता है, और पीडीएफ के लिए परिवर्तित, के रूप में वादा किया था, का समर्थन करता है खोज पाठ। नकारात्मक पक्ष यह विकल्प और मैन्युअल प्रक्रिया को नियंत्रित करने के लिए बहुत अल्प साधन की कमी है। लेकिन इस आंशिक रूप से उचित है, इस तथ्य यह एक एक्सप्रेस संस्करण है और यह अपने आप काम करता है।
FineReader एक्सप्रेस कार्यक्रम जीता के लिए कोड ग्रेगरी Ushar और निकोलाई Blinov. बधाई! अपने निजी संदेशों की जाँच करें, कोड भेजा है।