pytesser-Python(光学式文字認識)用のOCRライブラリ

今日、私はGoogleのプロジェクトをさまようと、かなり興味深い開発に出会いました-pytesser 開発者によると、画像内のテキストを認識します。 ライブラリはtesseract-ocrとPILを使用します。



使用例:



>>> from pytesser import *

>>> image = Image.open('fnord.tif') # Open image object using PIL

>>> print image_to_string(image) # Run tesseract.exe on image

fnord

>>> print image_file_to_string('fnord.tif')

fnord








私にとって大きなマイナスは、Windowsでのみ使用できることです。 したがって、この開発をテストできませんでした。



テスト用のライブラリには、次の画像が含まれています。これは、(理論的には、著者がそこに置いたら)認識すべきものです。



画像



他の画像のhabralumeyテスト結果から聞きたいです。



公式ページ: code.google.com/p/pytesser



All Articles