從計算機圖像、深度學(xué)習(xí)和OpenCV開始(目錄P4)
光學(xué)字符識別(OCR)
計算機視覺最早的應(yīng)用之一是光學(xué)字符識別(OCR)。
OCR算法尋求:
(1)獲取輸入圖像
(2)識別圖像中的文本/字符,將人類可讀的字符串返回給用戶(在這種情況下,假設(shè)“字符串”是包含已識別文本的變量)。
雖然OCR是一個簡單的概念(輸入圖像,輸出人類可讀的文本),但它實際上是一個極具挑戰(zhàn)性的問題,遠(yuǎn)未解決。
本節(jié)中的步驟將為您提供構(gòu)建自己的OCR管道所需的知識。
?Step #1:安裝OpenCV(初級)
Step #2:探索用于OCR的Tesseract(初級)
Step #3:不使用Tesseract的OCR(中級)
Step #4:通過小型項目練習(xí)OCR(中級)
Step #5:自然場景中的文本檢測(中級)
Step #6:將文本檢測與OCR相結(jié)合(高級)
標(biāo)簽: