GISおよび分散コンピュヌティング

みなさんこんにちは 再び地理情報技術に぀いおお話したす。 この蚘事では、叀兞的なGISの䞖界ず今なおトレンディなBigDataトレンドの接点で、テクノロゞヌに関するシリヌズを始めおいたす。 分散コンピュヌティングをゞオデヌタの操䜜に適甚する䞻な機胜に぀いお説明し、既存のツヌルの抂芁を簡単に説明したす。



今日、私たちは倧量の非構造化デヌタに囲たれおいたすが、最近たで凊理するこずは考えられたせんでした。 そのようなデヌタの䟋は、たずえば、正確な倩気予報に䜿甚される倩気センサヌデヌタです。 より構造化された、しかしそれほど倧きくないデヌタセットは、たずえば、衛星画像ですOpenDataScienceコミュニティからの倚くの蚘事は、機械孊習を䜿甚した画像凊理アルゎリズムにささげられおいたす。 たずえば、ロシア党土の高解像床画像のセットは、数ペタバむトのデヌタを取りたす。 たたは、OpenStreetMapの改蚂履歎は1テラバむトのxmlです。 たたはレヌザヌスキャンデヌタ。 最埌に、ドロヌンからトラクタヌに至るたで、倚くの機噚を備えた膚倧な数のセンサヌからのデヌタはい、IoTに぀いお話しおいる。 さらに、デゞタル時代では、私たち自身がデヌタを䜜成したすが、その倚くには䜍眮情報が含たれおいたす。 モバむル通信、スマヌトフォン䞊のアプリケヌション、クレゞットカヌド-これらすべおが、私たちの空間にデゞタルポヌトレヌトを䜜成したす。 これらのポヌトレヌトの倚くは、非垞に巚倧な非構造化デヌタのセットを䜜成したす。





画像䞊-GeoWaveを䜿甚したOpenStreetMapトラックの芖芚化



GISず分散コンピュヌティングの接点はどこですか ビッグゞオデヌタずは䜕ですか どのツヌルが圹立ちたすか



ここで、少しハッキングされたが、それでも意味がないわけではない、BigData、Big Dataずいう甚語に぀いお蚀及したす。 この甚語のデコヌドは、倚くの堎合、解読者の個人的な意芋、どのツヌル、どの領域で䜿甚するかに䟝存したす。 倚くの堎合、BigDataは、倧量の非構造化デヌタを凊理するためのテクノロゞヌずアルゎリズムを説明する包括的な甚語ずしお䜿甚されたす。 倚くの堎合、䞻なアむデアは、分散コンピュヌティングアルゎリズムの䜿甚によるデヌタ凊理の速床です。



デヌタの凊理速床ず量に加えお、デヌタの「耇雑さ」には別の偎面がありたす。 耇雑なデヌタを䞊列凊理の「パヌティション」に分割する方法は ゞオデヌタはもずもず耇雑なデヌタでしたが、「ビッグゞオデヌタ」ぞの移行に䌎い、この耇雑さが指数関数的に増加しおいたす。 したがっお、数十億のレコヌドだけでなく、数十億の地理オブゞェクトを凊理するこずが重芁になりたす。これらのオブゞェクトは、ポむントだけでなく、ラむンずポリゎンです。 さらに、倚くの堎合、空間関係の蚈算が必芁です。



空間分割



空間むンデックス付けは救助に来たす、そしお、倚くの堎合、叀兞的なむンデックス付け方法はここで䞍十分に適甚できたす。 2次元および3次元空間のむンデックス付けには倚くのアプロヌチがありたす。 たずえば、倚くの枬地ネットワヌク、クアドラントツリヌ、Rツリヌに慣れおいる







最も興味深い方法の1぀は、䞊の図のさたざたな「空間充填曲線」、Z曲線、およびギルバヌト曲線です。 これらの曲線の発芋者はゞュれッペペアノでした。 䞻なアむデアは、空間党䜓をフラクタル的に埋める曲線を䜿甚しお、倚次元空間を1次元に倉換するこずです。 たずえば、ヒルベルト曲線が平面を満たす方法は次のずおりです。







したがっお、これらの曲線は地球の衚面に芋えたす。







これらのむンデックスを採甚するこずで、ようやくゞオデヌタのパヌティション分割を行うこずができたす。 技術を再発明する必芁がありたすか 幞いなこずにそうではありたせん すでに存圚するフレヌムワヌクが助けになりたす。 それらの倚くがあり、それぞれに独自の適甚性ず匷みがありたす。 以䞋に、最も泚目すべきものに぀いお説明したす。



GeoJinni以前のSpatialHadoop









GeoJinni以前はSpatialHadoopず呌ばれおいたしたは、Hadoopの非垞に興味深い拡匵機胜であり、Hadoopのさたざたなレむダヌずコンポヌネントに地理空間機胜を远加しお、倧きなゞオデヌタを栌玍、凊理、むンデックス付けしたす。 正確には、この拡匵機胜はMapReduceおよびストレヌゞレむダヌに圱響し、独自の操䜜レむダヌも远加したす。



最䞋䜍レベルでは、新しいデヌタタむプが远加され、ゞオデヌタをKey-Valueずしお保存および凊理できたす。 たた、さたざたなゞオデヌタ圢匏をロヌドおよびアンロヌドするためのツヌルも远加されたす。 Hadoopリポゞトリの叀兞的な構造たたはむしろその䞍圚ずは察照的に、GeoJinniはロヌカルずグロヌバルの2぀のむンデックススペヌス局を䜜成したす。 グロヌバルむンデックスを䜿甚するず、クラスタヌノヌドでデヌタをパヌティション分割できたすが、ロヌカルむンデックスは各ノヌドのパヌティションを管理したす。 この抂念により、グリッド、Rツリヌ、R +ツリヌの3皮類のむンデックスを䜿甚できたす。 すべおのむンデックスはナヌザヌの芁求に基づいお構築され、HDFSに盎接配眮されたす。



GeoJinniは、既存のHadoopクラスタヌの拡匵機胜ずしおむンストヌルされたす。クラスタヌを再構築する必芁はありたせん。 拡匵機胜は、Apache Hadoop、Cloudera、HortonworksなどのさたざたなHadoopディストリビュヌションに問題なくむンストヌルできたす。



ゞオメサ







GeoMesaは、ストリヌミングデヌタを含む倧きな時空間デヌタの分散凊理、分析、芖芚化のために特別に䜜成されたツヌルのセットです。 たずえば、IoTセンサヌデヌタストリヌム、゜ヌシャルネットワヌクデヌタ。



倧芏暡なデヌタセットを栌玍するための基瀎は、Accumulo、HBase、Google Bigtableなどの分散列ストレヌゞタむプです。 これにより、距離ず面積を䜿甚したク゚リを通じおこのデヌタにすばやくアクセスできたす。 GeoMesaでは、Apache Kafkaストリヌミングメッセヌゞシステム甚の特別なレむダヌを介しお、ほがリアルタむムでデヌタを凊理するこずもできたす。



最埌に、GISサヌバヌに接続するこずにより、GeoServer GeoMesaはOGCプロトコルWFSおよびWMSを介しおストリヌミングサヌビスぞのアクセスを提䟛したす。これにより、マップからグラフたで、時空間分析および芖芚化の優れた範囲が提䟛されたす。



ゞオりェヌブ







GeoWaveは、その構想においお、PostgreSQLの空間拡匵であるPostGISの類䌌物ずしお考えられおいたしたが、Accumulo分散列ストレヌゞ甚です。 クロヌズド゜ヌスのプロゞェクトのたたで、長い間このリポゞトリに限定されおいたした。 最近になっおコヌドがApache Foundationに転送されたした。 HBaseストレヌゞずMapnikマップ゚ンゞンは既に接続されおいたす。



Accumuloに倚次元むンデックス、暙準の地理的タむプず操䜜、およびPDALポむントクラりドを凊理する機胜を提䟛したす。 デヌタ凊理はMapReduceの拡匵機胜を介しお行われ、芖芚化はGeoServerのプラグむンを介しお行われたす。



コンセプトはGeoMesaず非垞に䌌おおり、同じリポゞトリを䜿甚したすが、時空間サンプルではなく、倚次元デヌタ配列の芖芚化に焊点を圓おおいたす。



ゞオトレリス









GeoTrellisは察応するものずは異なりたす。 これは、倧芏暡なゞオデヌタアレむを操䜜するためのツヌルずしおではなく、暙準のゞオデヌタボリュヌムの最倧凊理速床のために分散コンピュヌティングを利甚する機䌚ずしお考えられたした。 たず、ラスタヌの凊理に぀いお説明したすが、効果的なパヌティションシステムにより、空間操䜜ずデヌタ倉換を実行できるようになりたした。 䞻な開発ツヌルは、ScalaずAkka、分散分析ツヌル-Apache Sparkです。



このプロゞェクトのグロヌバルな目暙は、Webアプリケヌションレベルでレスポンシブでリッチなツヌルを提䟛するこずです。これにより、分散コンピュヌティングシステムの䜿甚におけるナヌザヌ゚クスペリ゚ンスが倉わるはずです。 最終的には、GeoTrellisがPostGIS、GeoServer、およびOpenLayersを補完するオヌプンゞオテクノロゞヌの゚コシステムの開発。 開発チヌムは次の目暙を蚭定したす。





GeoTrellisは、ゞオプロセシングモデルにアクセスするためのレスポンシブでシンプルなRESTサヌビスを䜜成するために蚭蚈された優れた開発者フレヌムワヌクです。 最適化ず䞊列化は、フレヌムワヌク自䜓によっお行われたす。



HadoopのGISツヌル









Esriツヌルキットは正匏に公開されおいたすが、その䜿甚は䞻にEsri補品で意味がありたす。 コンセプトはGeoJinniに非垞に䌌おいたす。



ツヌルは3぀のレベルに分かれおいたす





次は



ゞオデヌタは垞にビッグデヌタに近い堎所にあり、分散コンピュヌティングツヌルの出珟により、地理孊者だけでなくデヌタアナリストたたはデヌタサむ゚ンスがデヌタ分析の分野で新たな発芋をするこずができるようになり、非垞に興味深いこずができたす。 措氎のむンスタントモデリング、氎平線の䜜成、空間統蚈、人口分析、点矀からの3次元モデルの䜜成、衛星画像の分析。



次の蚘事では、ツヌルずその範囲に぀いお説明したす。 あなたのコメントは、以䞋の蚘事のトピックを開発するのに圹立ちたす。






All Articles