OCR که سررشته کلمات Optical Character Recognition می باشد، به تکنیکی اطلاق می شود که در طی آن یک برنامه کامپیوتری متون موجود درتصاویر دیجیتالی را شناسایی کرده و آنها را به صورت خودکار به فایلهای متنی قابل ویرایش تبدیل می کند.ترجمة مناسبی که در زبان فارسی برای نرم افزارOCR در نظر گرفته شده است نویسه خوان نوری می باشد.
فرض کنید که ما متنی را روی کاغذ داریم و میخواهیم آن را وارد رایانه کنیم. اولین روشی که به ذهن میرسد این است که متن را به تایپیست بدهیم تا با کامپیوتر تایپ کند. اما آیا میشود عین همان متن را وارد رایانه بکنیم تا نیازی به تایپ نباشد؟
البته دستگاه «اسکنر» میتواند تصویری از آن متن را وارد رایانه کند، تا اینجا بخشی از مشکل ما حل شده است. اما رایانه که نه عقلی دارد و نه «زبان» میفهمد، نمیتواند حروف و کلمات را از هم تشخیص دهد.
برنامه OCR در Visual Basic (تشخیص دست خط کاربر)