OCR用の赤外線ライト

ご存知のように、Googleは世界中のすべての紙の本、つまり人類に関するすべての知識をスキャン、認識、インデックス化するように設定されています。 しかし、実際には、このプロセスは私たちが望むほど速く進行していません。 最も難しい段階は、通常のテキスト認識です。 OCRでは、歪みのない鮮明なページ画像が必要です。 ページ上のすべての行が完全に均等になるはずです。 実際には、本をスキャナーに押し付けることはできません(多くの場合、本のページにはまったく触れられません)。 それがそうであるかもしれないとして、ページの端に特徴的な曲率があります。 彼らはソフトウェア手法で戦っており、成功の度合いはさまざまです。



しかし、Googleはハードウェアでこの問題を解決する方法を考え出しました。 先週、彼らは本をスキャンする際の赤外線センサーの使用に関する特許を取得しました( 米国特許番号7508978 )。 アイデアの本質は、赤外線グリッドを使用してページの曲率の3次元モデルを作成できるため、画像を調整するプログラムが画像の変換方法の明確な座標を受け取ることです。







新しい科学者



All Articles