Wikistream-世界的なウィキペディアベースのオーディオガイド

画像

ウィキペディアに基づいた音声ガイドをリリースしました。



ウィキペディアでは、約100万件の記事が地球上の特定のポイントをジオリファレンスしています。 17万2千人は英語です。 ロシア語-17000。 私たちは、このすべての富を賢明な音声ガイドに変えました。

GPSとJavaまたはiPhone 3Gを搭載したスマートフォンをお持ちの場合に利用できます。 インターネットトラフィックに対してのみお支払いいただきます。



このトピックでは、プロジェクトの実装プロセスで発生した問題のいくつかについてお話したいと思います。



画像

1.判明したように、ウィキペディアで示された場所の座標は、データベース内の独立したエンティティではありません。 これは単なるテキストの一部です。 この場合、いくつかの座標(テキスト全体に散らばっている)が1つの記事に対応している場合があり、特定のオブジェクトを実際に説明していない座標を持つ記事が表示される場合があります。



2.逆変換で巨額の作業を行った外部サービスがあり、現在、座標によって記事のURLを取得する機会があります。 残念ながら、経験から、サービスが常に正しいとは限らないことが示されています(複製は長い遅延で発生する可能性が高い)。 また、非常に不安定です。 私たちは自分で偉業を繰り返すことを考えていますが、これまでのところ、私たちは持っている品質に我慢しなければなりません。



3.異なるサイズのすべての記事。 それらのいくつかは、ダビング後、30分で聞くことができません。 さらに、スコアリングプロセス自体に時間がかかり、コンテンツの抽出プロセス全体に割り当てられた2秒に満たない場合があります。 したがって、記事の構成を分析し、注釈を最も重要な部分として慎重に分離する必要があります。



4.記事に対応する物理オブジェクトには、実際には異なる「可視性」があります。 つまり、それらの一部は都市であり、観光客の視界の半径は10〜20キロメートルです。 他のオブジェクト(リーダーの記念碑)の半径はわずか30メートルです。 現在、記事のセマンティックロードの分析に取り組んでいますが、現在のところ、すべての記事は半径100メートルの円です。 Toozlaは任意の構成のオブジェクトをサポートしているため、どこからでもリスニングを開始できる複雑なシーケンシャルオーディオガイドを作成できます。



5.長い間、音声エンジンを選択しませんでした。 私たちにとってのベンチマークはロシア語の品質であり、ここで議論の余地のないリーダーは有名なスウェーデンの会社アカペラです。 便利なAPIがあり、最初の段階の言語の数は完全に満足しました。



ストリームの名前は明らかにウィキストリームです。 助けてくれたTarzanASGに感謝します。 AppStoreを終了する前にアプリケーションをテストしてくれた人に感謝します。

ロボットの演技の詳細と例。



Toozlaでは、有料のストリームと無料のストリームがあります。

ウィキストリームコンテンツは、すべてのウィキペディア(Creative Commons CC-BY-SA 3.0 Unportedの下でライセンスされています)と同様に、無料で提供されます。

Java用のアプリケーションは、サイトから無料ダウンロードできます。iPhoneの場合、アプリケーションはAppStoreで入手できます。



All Articles