GoogleドキュメントインデックスPDF

Googleドキュメントには、PDFドキュメントのテキストにインデックスを付ける機能が追加されているため、ドキュメントインターフェースから全文検索することもできます。 テキストは、ロシア語を含むテキストフィールドによってインデックス付けされます。







将来的には、Googleはグラフィックイメージ(OCR)からのテキスト認識システムも接続する必要があります。これは、検索エンジンGoogleの基本的なインデクサーで既に使用されており、実験として Google Docs APIからも利用できます。 その後、スキャンしたドキュメントを含む、あらゆるタイプのPDFのインデックスを作成できます。 確かに、ロシア語はまだGoogle OCRエンジンでサポートされていません。



Googleオペレーティングシステム経由



All Articles