Project Naptha-任意の画像からテキストを選択、コピー、翻訳

hh / gtで、Google Chromeのこのすばらしい拡張機能に関する言及が1つも見つかりませんでした。 最近、毎日10分節約できるので、コミュニティと共有したいと思っています-さまざまな言語のソーシャルネットワークのスクリーンショットが非常に多く、このプラグインを使用して2回クリックするだけで変換できます。



ミート-Project NapthaChromeウェブストア )。



画像



機能リスト:





このプロジェクトはKevin Kwokによって作成され、ブラウザ拡張機能としてJavaScriptで実装されたOCR(光学文字認識)システムです。



プロジェクトNapthaは、エンドユーザーにとってシンプルであるにもかかわらず、内部では非常に複雑です。



まず、テキスト認識自体が開始される前に、画像内のテキストを含むブロックが実際にどこにあるかを判断する必要があります。 テキストを完全に異なる背景の上に配置でき、それ自体が異なる色を持つことができるため、非常に重要な作業です。 このメカニズムを実装するために、NapthaはMicrosoftのストローク幅変換(SWT)プロジェクトを使用します。これは、フォントは通常ほぼ均一のフォントウェイトを持っているため、画像の残りのノイズからテキストブロックを簡単に分離できるという事実から始まります。



オリジナル:

画像



SWT後:

画像



もちろん、Napthaは開いているページのすべての画像を認識するわけではありません。リソースに関しては非常に無駄です。 代わりに、テキストブロックの位置の認識を開始します...いいえ さらにWebワーカー (バックグラウンドでのマルチスレッド)は、ブラウザーの速度を著しく低下させることなく、画像内のテキストの位置を認識することに取り組んでいます。



テキストブロックを選択して[テキストのコピー](Ctrl + C)をクリックすると、テキストを認識するためのオープンソースエンジンであるOcrad OCRを使用してサーバーに送信されます。 Ocradはテキスト内のビットマップイメージの一部を認識しようとします。これには数秒かかる場合があり、完了後は認識されたテキストが返されます。



翻訳機能はまだベータ版です。試してみるには、メールアドレスにリクエストを送信する必要があります。 モバイルデバイスでのGoogle翻訳で既に機能している対応物と同様に機能すると想定されています。







このプロジェクトはまだテスト段階にありますが、現時点でも仕事で使用するには十分です。 あなたは確かに詳細と可能なブレーキで欠陥を見つけることができますが、この製品は、私の知る限り、種類の一つであり、すでに私の時間を節約します。



All Articles