OCR Full Form in Hindi



OCR Full Form in Hindi, Full Form in Hindi OCR, OCR Meaning in Hindi, OCR Full Form, OCR Ka Full Form Kya Hai, OCR का Full Form क्या है, OCR Ka Poora Naam Kya Hai, OCR Meaning in English, OCR Full Form in Hindi, OCR Kya Hota Hai, OCR का Full Form क्या हैं, OCR का फुल फॉर्म क्या है, Full Form of OCR in Hindi, OCR किसे कहते है, OCR का फुल फॉर्म इन हिंदी, OCR का पूरा नाम और हिंदी में क्या अर्थ होता है, OCR का क्या Use है, दोस्तों क्या आपको पता है, OCR की Full Form क्या है, और OCR होता क्या है, अगर आपका answer नहीं है, तो आपको उदास होने की कोई जरुरत नहीं है, क्योंकि आज हम इस पोस्ट में आपको OCR की पूरी जानकारी हिंदी भाषा में देने जा रहे है, तो फ्रेंड्स OCR Full Form in Hindi में और OCR का पूरी इतिहास जानने के लिए इस पोस्ट को लास्ट तक पढ़े.

OCR Full Form in Hindi – ओसीआर क्या है ?

OCR की फुल फॉर्म "Optical Character Recognition" होती है. OCR को हिंदी में "ऑप्टिकल कैरेक्टर पहचान" कहते है.

ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) तकनीक स्कैन किए गए दस्तावेज़ या छवि फ़ाइल से मुद्रित या लिखित पाठ से डेटा निष्कर्षण को स्वचालित करने के लिए एक व्यावसायिक समाधान है और फिर टेक्स्ट को मशीन-पठनीय रूप में परिवर्तित करने के लिए संपादन या खोज जैसे डेटा प्रोसेसिंग के लिए उपयोग किया जाता है.

हालाँकि, OCR सिस्टम यांत्रिक और भौतिक भी हो सकते हैं. उदाहरण के लिए, आप इलेक्ट्रॉनिक पेंसिल से परिचित हो सकते हैं जो आपके लिखते ही आपकी लिखावट को स्वचालित रूप से स्कैन करती है. एक बार जब आप लिखना समाप्त कर लेते हैं, तो आप पेन को अपने कंप्यूटर (यूनिवर्सल सीरियल बस (USB), ब्लूटूथ, या अन्य) से जोड़ देते हैं. ओसीआर सॉफ्टवेयर तब आपके स्मार्टपेन द्वारा रिकॉर्ड किए गए आंदोलनों और छवियों का विश्लेषण करता है, जिसके परिणामस्वरूप मशीन-पठनीय पाठ होता है. यदि आपने किसी OCR सिस्टम का उपयोग किया है, चाहे वह Tesseract जैसा सॉफ़्टवेयर हो या कोई भौतिक OCR डिवाइस, आप जानते हैं कि OCR सिस्टम सटीक से बहुत दूर हैं. लेकिन ऐसा क्यों है? सतह पर, OCR इतना सरल विचार है, यकीनन संपूर्ण कंप्यूटर विज़न क्षेत्र में सबसे सरल विचार है. पाठ की एक छवि लें और इसे कार्य करने के लिए सॉफ़्टवेयर के एक टुकड़े के लिए मशीन-पठनीय पाठ में परिवर्तित करें. हालाँकि, 1960 के दशक में कंप्यूटर विज़न क्षेत्र की स्थापना के बाद से (पेपर, 1966), शोधकर्ताओं ने सामान्यीकृत OCR सिस्टम बनाने के लिए काफी संघर्ष किया है जो सामान्यीकृत उपयोग के मामलों में काम करते हैं.

ऑप्टिकल कैरेक्टर रिकग्निशन या ऑप्टिकल कैरेक्टर रीडर (ओसीआर) मशीन-एन्कोडेड टेक्स्ट में टाइप, हस्तलिखित या मुद्रित टेक्स्ट की छवियों का इलेक्ट्रॉनिक या यांत्रिक रूपांतरण है, चाहे स्कैन किए गए document से, दस्तावेज़ की एक Photo, एक दृश्य-फोटो (उदाहरण के लिए) एक Landscape photo में संकेतों और होर्डिंग पर पाठ) या एक छवि पर आरोपित उपशीर्षक पाठ से (उदाहरण के लिए: एक टेलीविजन प्रसारण से).

Printed paper data record से डेटा प्रविष्टि के रूप में व्यापक रूप से use किया जाता है - चाहे पासपोर्ट दस्तावेज़, चालान, बैंक विवरण, कम्प्यूटरीकृत रसीदें, व्यवसाय कार्ड, मेल, स्टेटिक-डेटा के Print out, या कोई उपयुक्त Documentation यह Digitize printed करने का एक सामान्य तरीका है ग्रंथों को इलेक्ट्रॉनिक रूप से संपादित किया जा सकता है, खोजा जा सकता है, अधिक Compact रूप से Archived किया जा सकता है, Displayed online किया जा सकता है, और मशीन प्रक्रियाओं जैसे संज्ञानात्मक कंप्यूटिंग, मशीन अनुवाद, (निकाले गए) टेक्स्ट-टू-स्पीच, कुंजी डेटा और टेक्स्ट खनन में उपयोग किया जा सकता है. OCR Pattern Recognition, Artificial Intelligence और कंप्यूटर विज़न में Research का एक क्षेत्र है.

प्रारंभिक संस्करणों को प्रत्येक चरित्र की छवियों के साथ प्रशिक्षित करने की आवश्यकता थी, और एक समय में एक फ़ॉन्ट पर काम किया. अधिकांश फोंट के लिए उच्च स्तर की पहचान सटीकता का उत्पादन करने में सक्षम उन्नत प्रणालियां अब आम हैं, और विभिन्न डिजिटल छवि फ़ाइल प्रारूप इनपुट के समर्थन के साथ. कुछ Systems formatted output को पुन: प्रस्तुत करने में सक्षम हैं जो images, स्तंभों और अन्य Non-text components सहित मूल पृष्ठ का बारीकी से अनुमान लगाते हैं.

साधारण तथ्य यह है कि ओसीआर कठिन है -

लेखन के माध्यम से मनुष्य कैसे संवाद करते हैं, इसमें बहुत सारी बारीकियां हैं - हमारे पास प्राकृतिक भाषा प्रसंस्करण (एनएलपी) की सभी समस्याएं हैं, इस तथ्य के साथ जटिल है कि किसी छवि से पाठ के एक टुकड़े को पढ़ते समय कंप्यूटर विज़न सिस्टम कभी भी 100% सटीकता प्राप्त नहीं करेंगे. शोर, लेखन शैली, छवि गुणवत्ता आदि के मामले में बहुत अधिक चर हैं. हम ओसीआर को हल करने से बहुत दूर हैं. यदि ओसीआर पहले ही हल हो चुका होता, तो यह ट्यूटोरियल मौजूद नहीं होता - आपकी पहली Google खोज आपको उस पैकेज तक ले जाती जो आपको थोड़े प्रयास के साथ अपनी परियोजनाओं में ओसीआर को आत्मविश्वास और सटीक रूप से लागू करने के लिए आवश्यक होता. लेकिन यह वह World नहीं है जिसमें हम रहते हैं. जबकि हम ओसीआर समस्याओं को हल करने में बेहतर हो रहे हैं, फिर भी यह समझने के लिए एक कुशल व्यवसायी की जरूरत है कि मौजूदा ओसीआर उपकरणों को कैसे संचालित किया जाए. यही कारण है कि यह ट्यूटोरियल मौजूद है - और मैं आपके साथ इस यात्रा को शुरू करने के लिए और इंतजार नहीं कर सकता.

ओसीआर का परिचय ?

हम इस खंड की शुरुआत OCR के एक संक्षिप्त इतिहास के साथ करेंगे, जिसमें यह भी शामिल है कि यह कंप्यूटर विज़न सबफ़ील्ड कैसे बना. इसके बाद, हम OCR के कुछ वास्तविक-विश्व अनुप्रयोगों की समीक्षा करेंगे (जिनमें से कुछ हम ट्यूटोरियल के अंदर बनाएंगे). इसके बाद हम संक्षेप में OSD की अवधारणा पर चर्चा करेंगे, जो किसी भी OCR प्रणाली का एक अनिवार्य घटक है. इस ट्यूटोरियल का अंतिम भाग इमेज प्री-प्रोसेसिंग और ओसीआर परिणाम पोस्ट-प्रोसेसिंग की अवधारणा को पेश करेगा, ओसीआर सटीकता में सुधार के लिए उपयोग की जाने वाली दो सामान्य तकनीकें.

जब कंपनियां अपने कागजात को इलेक्ट्रॉनिक दस्तावेजों में बदलने के लिए दस्तावेज़ स्कैनिंग के साथ कागज रहित कार्यालय में परिवर्तित हो जाती हैं, तो उन्हें यह समझने की आवश्यकता होती है कि डिजिटल छवियों के रूप में उन अभिलेखों के साथ उन्हें क्या करने की आवश्यकता होगी. यदि दस्तावेजों को केवल अभिलेखीय या ऐतिहासिक उद्देश्यों के लिए स्कैन किया जा रहा है, तो एक साधारण इमेजिंग स्कैन जो संपूर्ण रूप से दस्तावेज़ को कैप्चर करता है, पर्याप्त होना चाहिए. यदि आप दस्तावेज़ों को बदलने और उन्हें सक्रिय रिकॉर्ड के रूप में उपयोग करने की योजना बना रहे हैं, तो आप स्कैन की गई छवि को एक टेक्स्ट दस्तावेज़ में बदलना चाहते हैं ताकि बाद में आसानी से अपडेट किया जा सके. ऐसा करने के लिए, स्कैनिंग कंपनियां ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) नामक एक सॉफ्टवेयर एप्लिकेशन का उपयोग करती हैं.

ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) टाइप, हस्तलिखित या मुद्रित टेक्स्ट की छवियों को मशीन-एन्कोडेड टेक्स्ट में बदलना है. यह व्यापक रूप से मुद्रित पेपर डेटा रिकॉर्ड से डेटा प्रविष्टि के रूप में उपयोग किया जाता है, चाहे पासपोर्ट दस्तावेज़, चालान, बैंक विवरण, कम्प्यूटरीकृत रसीदें, व्यवसाय कार्ड, मेल, स्थिर-डेटा के प्रिंटआउट, या कोई उपयुक्त दस्तावेज़. यह मुद्रित ग्रंथों को डिजिटाइज़ करने का एक सामान्य तरीका है ताकि इसे इलेक्ट्रॉनिक रूप से संपादित किया जा सके, खोजा जा सके, अधिक कॉम्पैक्ट रूप से संग्रहीत किया जा सके और ऑनलाइन प्रदर्शित किया जा सके, सॉफ्टवेयर छवियों का विश्लेषण करता है और पाठ के शब्दों को निकालता है. वे बहुत सटीक हो गए हैं, और हस्तलिखित दस्तावेजों के साथ भी काम कर सकते हैं (लेकिन गन्दी लिखावट में मुद्रित पाठ के समान सटीकता नहीं होगी). फाइलों से संरचित डेटा भी निकाला जा सकता है. यह डेटा एब्स्ट्रैक्शन का उपयोग करके किया जा सकता है जो डेटा को ईएचआर जैसे इलेक्ट्रॉनिक दस्तावेज़ प्रबंधन प्रणाली में डालता है. यह प्रपत्रों से डेटा निकालने के लिए भी किया जा सकता है. एक बार जब रिकॉर्ड टेक्स्ट फॉर्म में हो जाते हैं तो किसी भी दस्तावेज़ संपादन प्रोग्राम द्वारा बदला जा सकता है. सामान्य लोग माइक्रोसॉफ्ट वर्ड या माइक्रोसॉफ्ट एक्सेल होंगे.

ओसीआर का एक संक्षिप्त इतिहास ?

प्रारंभिक ओसीआर प्रौद्योगिकियां विशुद्ध रूप से यांत्रिक थीं, 1914 में वापस डेटिंग जब "इमैनुएल गोल्डबर्ग ने एक ऐसी मशीन विकसित की जो वर्णों को पढ़ सकती थी और फिर उन्हें मानक टेलीग्राफ कोड में परिवर्तित कर सकती थी" (धवले, 2017, पृष्ठ. 91). गोल्डबर्ग ने 1920 और 1930 के दशक में अपना शोध जारी रखा जब उन्होंने एक ऐसी प्रणाली विकसित की जो पात्रों के लिए माइक्रोफिल्म (स्केल-डाउन दस्तावेज़, आमतौर पर फ़िल्में, समाचार पत्र, पत्रिकाएँ, आदि) खोजती थी और फिर उन्हें OCR'd करती थी. 1974 में, Ray Kurzweil और Kurzweil Computer Products, Inc. ने OCR सिस्टम विकसित करना जारी रखा, मुख्य रूप से "अंधों के लिए रीडिंग मशीन" बनाने पर ध्यान केंद्रित किया. कुर्ज़वील के काम ने उद्योग के नेता ज़ेरॉक्स का ध्यान आकर्षित किया, जो आगे सॉफ्टवेयर का व्यावसायीकरण करना चाहते थे और दस्तावेज़ को समझने के लिए ओसीआर अनुप्रयोगों को विकसित करना चाहते थे. Hewlett-Packard (HP) Labs ने 1980 के दशक में Tesseract पर काम करना शुरू किया. एचपी का काम 2005 में खुला था, जो तेजी से दुनिया का सबसे लोकप्रिय ओसीआर इंजन बन गया. Tesseract लाइब्रेरी शायद यही कारण है कि आप अभी इस ट्यूटोरियल को पढ़ रहे हैं. 2010 के दशक में जब डीप लर्निंग ने कंप्यूटर विज़न (साथ ही कंप्यूटर विज्ञान के लगभग हर दूसरे क्षेत्र) के क्षेत्र में क्रांति ला दी, तो OCR सटीकता को लॉन्ग-टर्म मेमोरी (LSTM) नेटवर्क नामक विशेष आर्किटेक्चर से जबरदस्त बढ़ावा दिया गया. अब, 2020 के दशक में, हम देख रहे हैं कि कैसे Google, Microsoft और Amazon जैसे टेक दिग्गजों द्वारा OCR का तेजी से व्यवसायीकरण किया गया है. हम कंप्यूटर विज्ञान के क्षेत्र में एक शानदार समय में मौजूद हैं - हमारे पास इतना शक्तिशाली और सटीक ओसीआर सिस्टम पहले कभी नहीं था. लेकिन तथ्य यह है कि ये ओसीआर इंजन अभी भी एक जानकार कंप्यूटर विज़न प्रैक्टिशनर को संचालित करने के लिए लेते हैं. यह पाठ आपको ठीक से ऐसा करना सिखाएगा.

ओसीआर समाधान उपयोगकर्ताओं के लिए सूचना पहुंच में सुधार करते हैं -

ओसीआर तकनीक का एक सामान्य अनुप्रयोग एक छवि आधारित पीडीएफ, टीआईएफएफ या जेपीजी का पाठ आधारित मशीन-पठनीय फ़ाइल में स्वचालित रूपांतरण है. ओसीआर-संसाधित डिजिटल फाइलें, जैसे रसीदें, अनुबंध, चालान, वित्तीय विवरण और बहुत कुछ, ये हो सकते हैं:-

सही दस्तावेज़ खोजने के लिए एक बड़े भंडार से खोजा गया

देखा गया, प्रत्येक दस्तावेज़ में खोज क्षमता के साथ

संपादित, जब सुधार करने की आवश्यकता है

अन्य प्रणालियों को भेजे गए निकाले गए पाठ के साथ पुन: तैयार किया गया

व्यवहार में ओसीआर क्या शामिल करता है?

अधिकांश लोगों को औद्योगिक पैमाने पर ओसीआर का उपयोग करने की आवश्यकता नहीं होती है: हममें से बहुतों को एक दिन में सौ दस्तावेजों को भी स्कैन करने की आवश्यकता नहीं होगी, दस लाख की परवाह किए बिना. हम कभी-कभी मुद्रित लेख को ओसीआर करना चाहते हैं और इसे संपादन योग्य रूप में बदलना चाहते हैं, या कॉपीराइट से बाहर की पुस्तक को स्कैन करके इसे वेब पेज के रूप में पुन: प्रकाशित करना चाहते हैं.

व्यवहार में, दैनिक ओसीआर में वास्तव में यही शामिल होता है:-

प्रिंटआउट: सबसे पहले, आपको अपने मौजूदा दस्तावेज़ का सर्वोत्तम संभव प्रिंटआउट प्राप्त करने की आवश्यकता है. कभी-कभी आप बस एक पुरानी टाइपराइट स्क्रिप्ट के साथ फंस जाते हैं, लेकिन आप फोटोकॉपी करके प्रिंट की गुणवत्ता में सुधार करने में सक्षम हो सकते हैं (प्रिंट और पेज के बीच कंट्रास्ट बढ़ाने के लिए). मूल प्रिंटआउट की गुणवत्ता OCR प्रक्रिया की सटीकता पर बहुत बड़ा अंतर डालती है. गंदे निशान, सिलवटों, कॉफी के दाग, स्याही के धब्बे, और किसी भी अन्य आवारा निशान सभी सही अक्षर और शब्द पहचान की संभावना को कम कर देंगे.

स्कैनिंग: आप अपने ऑप्टिकल स्कैनर के माध्यम से प्रिंटआउट चलाते हैं. फ्लैटबेड स्कैनर की तुलना में ओसीआर के लिए शीट-फीड स्कैनर बेहतर हैं क्योंकि आप एक के बाद एक पेज स्कैन कर सकते हैं. अधिकांश आधुनिक ओसीआर प्रोग्राम प्रत्येक पृष्ठ को स्कैन करेंगे, उस पर पाठ को पहचानेंगे, और फिर अगले पृष्ठ को स्वचालित रूप से स्कैन करेंगे. यदि आप फ़्लैटबेड स्कैनर का उपयोग कर रहे हैं, तो आपको एक-एक करके पृष्ठों को हाथ से सम्मिलित करना होगा. यदि आपके पास एक अच्छा डिजिटल कैमरा है, तो आप फ़ोटो लेकर अपने पृष्ठों की छवियां बनाने में सक्षम हो सकते हैं. वास्तव में सटीक ओसीआर के लिए पर्याप्त स्पष्ट अक्षरों को प्राप्त करने के लिए आपको संभवतः मैक्रो (क्लोज़-अप) फ़ोकस सेटिंग का उपयोग करने की आवश्यकता होगी.

दो-रंग: OCR में पहले चरण में रंग या ग्रेस्केल स्कैन किए गए पृष्ठ का एक श्वेत-श्याम (दो-रंग/एक-बिट) संस्करण बनाना शामिल है, जैसा कि आप फ़ैक्स मशीन से बाहर आते हुए देखेंगे. ओसीआर अनिवार्य रूप से एक द्विआधारी प्रक्रिया है: यह उन चीजों को पहचानती है जो या तो वहां हैं या नहीं. यदि मूल स्कैन की गई छवि सही है, तो इसमें शामिल कोई भी काला एक चरित्र का हिस्सा होगा जिसे पहचानने की आवश्यकता है, जबकि कोई भी सफेद पृष्ठभूमि का हिस्सा होगा. छवि को श्वेत और श्याम में कम करना इसलिए उस पाठ का पता लगाने का पहला चरण है जिसे संसाधित करने की आवश्यकता है-हालाँकि यह त्रुटियों को भी पेश कर सकता है. यदि आपके पास शब्दों पर एक बड़े भूरे रंग के कॉफी के दाग वाले अखबार का रंग स्कैन है, तो दाग से पाठ को बताना आसान है; लेकिन अगर आप स्कैन को एक श्वेत-श्याम छवि में कम करते हैं, तो दाग भी काला और सफेद हो जाएगा और OCR प्रक्रिया को भ्रमित कर सकता है.

ओसीआर: सभी ओसीआर कार्यक्रम थोड़े अलग होते हैं, लेकिन आम तौर पर वे प्रत्येक पृष्ठ की छवि को चरित्र द्वारा पाठ वर्ण, शब्द द्वारा शब्द और पंक्ति द्वारा पंक्ति को पहचानकर संसाधित करते हैं. 1990 के दशक के मध्य में, ओसीआर कार्यक्रम इतने धीमे थे कि आप प्रतीक्षा करते समय उन्हें शाब्दिक रूप से "पढ़ते" और पाठ को संसाधित करते हुए देख सकते थे; कंप्यूटर अब बहुत तेज हैं और ओसीआर काफी तात्कालिक है.

बुनियादी त्रुटि सुधार: कुछ प्रोग्राम आपको बारी-बारी से प्रत्येक पृष्ठ की समीक्षा करने और उसे ठीक करने का अवसर देते हैं: वे तुरंत पूरे पृष्ठ को संसाधित करते हैं और फिर किसी भी गलत वर्तनी वाले शब्दों को उजागर करने के लिए एक अंतर्निहित वर्तनी जांचकर्ता का उपयोग करते हैं जो गलत पहचान का संकेत दे सकता है, ताकि आप स्वचालित रूप से सही कर सकें भूल. आप आमतौर पर इस सुविधा को बंद कर सकते हैं यदि आप चाहते हैं, यदि आपके पास स्कैन करने के लिए कई पृष्ठ हैं और आप उन सभी की जांच नहीं करना चाहते हैं जैसे आप साथ जा रहे हैं. परिष्कृत ओसीआर कार्यक्रमों में गलतियों को पहचानने में आपकी मदद करने के लिए अतिरिक्त त्रुटि जाँच सुविधाएँ होती हैं. उदाहरण के लिए, कुछ ऐसे शब्दों को खोजने के लिए निकट-पड़ोसी विश्लेषण का उपयोग करते हैं जो आस-पास होने की संभावना है, इसलिए गलत तरीके से "भौंकने वाला दलदल" के रूप में पहचाने जाने वाले पाठ को स्वचालित रूप से "भौंकने वाले कुत्ते" में बदल दिया जा सकता है (क्योंकि "भौंकने" और "कुत्ता" दो शब्द हैं जो अक्सर एक साथ चलते हैं).

लेआउट विश्लेषण: अच्छे OCR प्रोग्राम जटिल पेज लेआउट का स्वतः ही पता लगा लेते हैं, जैसे टेक्स्ट, टेबल, इमेज आदि के कई कॉलम. छवियों को स्वचालित रूप से ग्राफिक्स में बदल दिया जाता है, टेबल (भाग्य के साथ) टेबल में बदल जाते हैं, और कॉलम सही ढंग से विभाजित होते हैं (इसलिए पहले कॉलम की पहली पंक्ति से टेक्स्ट स्वचालित रूप से दूसरे की पहली पंक्ति से टेक्स्ट में शामिल नहीं होता है स्तंभ).

प्रूफरीडिंग: यहां तक ​​कि सबसे अच्छे ओसीआर प्रोग्राम भी सही नहीं होते हैं, खासकर जब वे बहुत पुराने दस्तावेज़ों या खराब गुणवत्ता वाले मुद्रित टेक्स्ट से काम कर रहे हों. इसलिए ओसीआर में अंतिम चरण हमेशा एक अच्छा, पुराने जमाने का मानव प्रूफरीड होना चाहिए.

ओसीआर का आविष्कार किसने किया?

अधिकांश लोग सोचते हैं कि मानव पाठ को पढ़ने के लिए मशीन प्राप्त करना अपेक्षाकृत हाल ही में किया गया नवाचार है, लेकिन यह आपके अनुमान से अधिक पुराना है. यहां ओसीआर इतिहास के माध्यम से एक सीटी-स्टॉप टूर है:-

1928/9: ऑस्ट्रिया के विएना के गुस्ताव तौशेक ने एक बुनियादी ओसीआर "रीडिंग मशीन" का पेटेंट कराया. जनरल इलेक्ट्रिक के पॉल हैंडेल ने अप्रैल 1931 में संयुक्त राज्य अमेरिका में एक समान प्रणाली के लिए एक पेटेंट फाइल किया. दोनों कागज या कार्ड पर पैटर्न को पहचानने के लिए प्रकाश-पहचान करने वाले फोटोकल्स का उपयोग करने के विचार पर आधारित हैं.

1949: एल.ई. फ्लोरी और डब्ल्यू.एस. आरसीए प्रयोगशालाओं के पाइक ने एक फोटोकेल-आधारित मशीन विकसित की है जो नेत्रहीन लोगों को 60 शब्द प्रति मिनट की दर से पाठ पढ़ सकती है. (इसके बारे में सब कुछ फरवरी 1949 के पॉपुलर साइंस के अंक में पढ़ें.)

1950: डेविड एच. शेपर्ड ने ऐसी मशीनें विकसित कीं जो अमेरिकी सेना के लिए मुद्रित जानकारी को मशीन-पठनीय रूप में बदल सकती हैं और बाद में इंटेलिजेंट मशीन्स रिसर्च (आईएमआर) नामक एक अग्रणी ओसीआर कंपनी की स्थापना की. शेफर्ड एक मशीन-पठनीय फ़ॉन्ट भी विकसित करता है जिसे फरिंगटन बी (जिसे ओसीआर -7 बी और 7 बी-ओसीआर भी कहा जाता है) कहा जाता है, अब व्यापक रूप से क्रेडिट कार्ड पर उभरा हुआ नंबर प्रिंट करने के लिए उपयोग किया जाता है.

1960: लॉरेंस (लैरी) रॉबर्ट्स, एमआईटी में काम कर रहे एक कंप्यूटर ग्राफिक्स शोधकर्ता, ओसीआर-ए जैसे विशेष रूप से सरलीकृत फोंट का उपयोग करके प्रारंभिक पाठ पहचान विकसित करते हैं. वह बाद में इंटरनेट के संस्थापक पिताओं में से एक बन गया.

1950/1960: रीडर्स डाइजेस्ट और आरसीए कुछ पहले वाणिज्यिक ओसीआर सिस्टम विकसित करने के लिए मिलकर काम करते हैं.

1960 का दशक: दुनिया भर में डाक सेवाओं ने मेल-सॉर्टिंग के लिए OCR तकनीक का उपयोग करना शुरू किया. इनमें यूएस पोस्टल सर्विस, ब्रिटेन का जनरल पोस्ट ऑफिस (जीपीओ, जिसे अब रॉयल मेल कहा जाता है), कनाडा पोस्ट और जर्मन ड्यूश पोस्ट शामिल हैं. लॉकहीड मार्टिन जैसी कंपनियों की मदद से डाक सेवाएं आज भी ओसीआर अनुसंधान में सबसे आगे हैं.

1974: रेमंड कुर्ज़वील ने कुर्ज़वील रीडिंग मशीन (केआरएम) विकसित की जो एक मशीन में एक फ्लैटबेड स्कैनर और स्पीच सिंथेसाइज़र को जोड़ती है जो नेत्रहीन लोगों को मुद्रित पृष्ठों को जोर से पढ़ सकता है. कुर्ज़वील का ओसीआर सॉफ्टवेयर ज़ेरॉक्स द्वारा अधिग्रहित किया गया है और स्कैनसॉफ्ट और (बाद में) नुअंस कम्युनिकेशंस के नाम से विपणन किया गया है.

1993: ऐप्पल न्यूटन मैसेजपैड (पीडीए) टच-सेंसिटिव स्क्रीन पर हस्तलेखन पहचान की सुविधा देने वाले पहले हैंडहेल्ड कंप्यूटरों में से एक है. 1990 के दशक के दौरान, हस्तलेखन पहचान सेलफोन, पीडीए (विशेषकर अग्रणी पाम और पामपायलट), और अन्य हैंडहेल्ड पर एक तेजी से लोकप्रिय विशेषता बन गई.

2000: कार्नेगी मेलॉन यूनिवर्सिटी के शोधकर्ताओं ने अपने सिर पर एक अच्छी ओसीआर प्रणाली विकसित करने की समस्या को पलट दिया- और कैप्चा नामक एक स्पैम-बस्टिंग सिस्टम विकसित किया (नीचे कैप्शन देखें).

2007: आईफोन के आगमन ने आसान, पॉइंट-एंड-क्लिक स्मार्टफोन ऐप के विकास को प्रेरित किया जो फोन कैमरे का उपयोग करके टेक्स्ट को स्कैन और कनवर्ट कर सकते हैं.