開発者ストーリー:MicroBlinkのPhotoMath

多くの世界の出版物がこのアプリケーションについて書いています。 また、 EngadgetTechcrunchCNETなどの技術的なものだけではありません。 Time誌Forbes and Business Insider 、Ellen DeGeneresショーなどの大手企業の注目を集めた小さなアプリ。







それでは、なぜPhotoMathはとても興味深いのでしょうか? おそらく、クロアチアのMicroBlink開発チームが魔法の杖を渡して複雑な数学の方程式を解くことで子供の頃の夢を実現したためです(実際、それはまったく有害ではありませんが、数学科学を教えるのに役立ちますが、後で詳しく説明します)。 私たちの同僚は、開発者に連絡を取り、この小さいながらも成功したアプリケーションがどのように作成されたか、そして今後彼らに何を期待すべきかについて話しました。 それまでの間、お子さんは最後の「Ready homework」を燃やします。このインタビューの抜粋を読んでください。



しかし、最初に、アプリケーションについてもう少し話しましょう。



無料のPhotoMathアプリケーションは、モバイルデバイスのカメラからのデータ認識技術(OCR技術)に基づいた数学方程式を解くための便利で視覚的なツールとして考案されました。







方程式を計算するために必要なことは、スマートフォンのカメラをタスクに向け、方程式の境界を選択し(手動で調整できます)、例を撮影し、解が画面に表示されるまで待ちます。 アプリは、紙と画面の両方からタスクをスキャンできますが、2番目の場合、処理に時間がかかる場合があります。



手書きのテキストがまだ認識されておらず、多くのユーザーが開発者からこの機能を追加することを期待して、アプリケーションストアのレビューにinしていることをすぐに予約します。







アプリケーションの教育的な部分は、アプリケーションが正しい答えを提供するだけでなく、数学の方程式を解くすべての段階を表示できることです。 これらのサンプルは特別なセクションに自動的に保存されるため、アプリケーションを使用して解決されたすべてのサンプルにいつでも戻ることができます。







上記の例では、Windows Phone Storeからダウンロードした後、Lumiaスマートフォン用PhotoMathを試すことができます。 アプリケーションはiOS用のバージョンにも存在し、まもなくAndroidプラットフォームに表示されるはずです。



PhotoMathを開発するきっかけは何ですか?



私たちは、銀行部門の複数のクライアント向けにモバイルOCRテクノロジーとアプリケーションを開発し、支払いの転送と請求書の支払いを目的としています。 これらのプログラムに実装されたテキスト認識技術により、ユーザーはスマートフォンのカメラを使用して、数秒でデバイスにデータを転送し、支払うことができました。 ある時点で、開発のアプリケーションを他の領域に拡張したかったのですが、実際のデモアプリケーションはありませんでした。



同僚の1人は、[息子の宿題を頻繁に確認する必要があるため]数学の問題をすばやく解決するためのアプリケーションが必要であり、そのようなアプリケーションを作成するのがいいと考えていました。 このアイデアがチーム全体に広まる前にAppCampusの一部として開催されているローカルイベントに既に申し込みました。 驚くべきことに、文字通り最初の試みで、私たちは彼らの心をつかみ、数ヶ月後にアプリケーションの開発のための助成金を受け取りました。







アプリケーションの人気が高まるにつれて、PhotoMathを使用して「システムをrickす」ことができ、学童や生徒の頭を完全に消して、すべての作業を行うことができるという話が増えています。 これについてどう思いますか?



チートしたい人は、どんなデバイスやチートシートを使ってもチートする方法を常に見つけられると私たちは正しく信じています。 PhotoMathアプリケーションを使用して、特定の例のソリューションを詳細に解析するアプリケーションを使用して、子供とその親が新しい方法で数学を学習できるようにします。



同意しますが、生徒が数学の問題を解決するのに助けを求める人がいない、または数学の親の知識が十分でないことがよくあります。 このような場合、PhotoMathアプリケーションが助けになります。



開発プロセスはどのように見えましたか?



開発プロセスは条件付きで2段階で行われました。 最初は、ユニバーサルOCRテクノロジーを開発しました。 そして、2〜3年かかりました。 そして約6か月後、数学エンジンとアプリケーション自体を開発するのに時間がかかりました。







私たちのチームの3人の若い開発者がアプリケーションに直接取り組みましたが、私たち3人の「昔の人」は製品の作成を監視し、開発プロセスを制御しただけでした。



無制限のリソースと予算がある場合、どのアプリケーションを開発しますか?



当社のすべての関心は、携帯機器での画像処理の技術に焦点を合わせているため、この分野で多くのアイデアを持っています。 私たちが実装したいと考えている最初のアプリケーションは、食べ物、あるいはさまざまな料理を認識できるモバイルアプリでした。 このようなアプリケーションは、ソーシャルネットワークで公開するコンテンツの準備から、料理の特定の物質のカロリーやコンテンツに関する最新の統計情報の出力まで、さまざまなオプションをユーザーに提供できます。





ファンタジーフライトのもう1つの例は、自宅やオフィス内を自律的に移動し、周囲のすべてのものを記憶するロボットです。 これは何のためですか? はい、ユーザーはこのロボットに接続されたロボットまたはモバイルアプリケーションに「メガネをどこで手に入れましたか」と尋ねることができます。



そして、そのようなアプリケーションは命を救う可能性があります。今日、人々はしばしば通りを歩き、携帯電話を見つめています。 道路を横断すると、彼らは事故の犯人になるだけでなく、それに苦しむ大きなチャンスがあります。 モバイルカメラとマイクを使用して周囲の空間を検査し、障害物を通知するようなアプリケーション(モバイルガーディアンエンジェルのようなもの)があると想像してください。 たとえば、目の前に段差がある場合、または交差点に近づいている場合。



近い将来、PhotoMathおよび他のアプリケーションで何が待ち受けていますか?



今日、私たちはPhotoMathとOCR技術の改善に全面的に注力しています。 数学的応用に関しては、近い将来、より複雑な計算の自動計算と認識システムの改善に取り組みます(いつか手書きを処理できるようになるかもしれません)。 当社の次のステップについてお話しする場合、現在、他の開発者が当社の認識技術を使用してアプリケーションを作成できるように、「マシンビジョン」SDKのリリースに取り組んでいます。







こちらからPhotoMathアプリケーションをLumiaにダウンロードできます。









そして次のように書きます: Geektimes | Twitter | VK | Facebook | Google+



All Articles