👐🏾 👨‍💼 🐡 pytesser-Python（光学式文字認識）用のOCRライブラリ 🧚🏾 👨🏿‍🏭 🧗

今日、私はGoogleのプロジェクトをさまようと、かなり興味深い開発に出会いました-pytesser 開発者によると、画像内のテキストを認識します。ライブラリはtesseract-ocrとPILを使用します。

使用例：

>>> from pytesser import * 
      

        
        
        
      

     >>> image = Image.open('fnord.tif') # Open image object using PIL 
      

        
        
        
      

     >>> print image_to_string(image) # Run tesseract.exe on image 
      

        
        
        
      

     fnord 
      

        
        
        
      

     >>> print image_file_to_string('fnord.tif') 
      

        
        
        
      

     fnord

私にとって大きなマイナスは、Windowsでのみ使用できることです。したがって、この開発をテストできませんでした。

テスト用のライブラリには、次の画像が含まれています。これは、（理論的には、著者がそこに置いたら）認識すべきものです。

他の画像のhabralumeyテスト結果から聞きたいです。

公式ページ： code.google.com/p/pytesser

pytesser-Python（光学式文字認識）用のOCRライブラリ

More articles: