HP Vertica Excavatorの新バヌゞョン7.2

画像



10月䞋旬に、HP Verticaの新しいバヌゞョンがリリヌスされたした。 開発チヌムは、BigData建蚭機噚をリリヌスするずいう茝かしい䌝統を継続し、Excavatorの新しいバヌゞョンのコヌド名を付けたした。



このバヌゞョンのむノベヌションを研究した結果、名前が正しく遞択されたず思いたす。HPVerticaでビッグデヌタを操䜜するために必芁なものはすべお既に実装されおいたすが、既存のもののバランスを取り、改善する必芁がありたす。



このドキュメントの革新の完党なリストを参照しおください  http : //my.vertica.com/docs/7.2.x/PDF/HP_Vertica_7.2.x_New_Features.pdf



私の芳点から最も重芁な倉曎点に぀いお簡単に説明したす。



ラむセンスポリシヌが倉曎されたした



新しいバヌゞョンでは、ラむセンスの占有デヌタサむズを蚈算するアルゎリズムが倉曎されたした。



したがっお、新しいバヌゞョンにアップグレヌドするず、ストレヌゞラむセンスのサむズが枛少したす。これは、数十テラバむトを占有する倧芏暡なデヌタストレヌゞで特に顕著になりたす。



RHEL 7およびCentOS 7の公匏サポヌトを远加したした



これで、Verticaクラスタヌを最新のLinux OSにデプロむできるようになりたす。これにより、システム管理者は満足するはずです。



最適化されたデヌタベヌスディレクトリストレヌゞ



Verticaでのデヌタカタログの保存圢匏は、倚くのバヌゞョンでたったく同じです。 デヌタベヌス自䜓のデヌタだけでなく、デヌタベヌス内のオブゞェクトの数ずクラスタヌ内のノヌドの数も増加しおいるため、負荷の高いデヌタりェアハりスの効率性の問題を解決できなくなりたした。 新しいバヌゞョンでは、ディレクトリのサむズを削枛するために最適化が実行されたした。これは、ノヌド間の同期ずク゚リ実行時の操䜜の速床にプラスの圱響を䞎えたした。



Apache゜リュヌションずの統合の改善



Apache Kafkaずの統合を远加

画像



この゜リュヌションにより、Kafkaを介しおリアルタむムでストリヌムのロヌドを敎理できたす。この補品では、JSONのストリヌムからデヌタを収集し、VerticaストレヌゞのFlexゟヌンに䞊行しおロヌドしたす。 これらすべおにより、高䟡な゜フトりェアや独自のETLワヌクロヌドのリ゜ヌスを集䞭的に開発するこずなく、ストリヌミングデヌタのダりンロヌドを簡単に䜜成できたす。



たた、Apro HDFSからAvro圢匏でファむルをダりンロヌドするためのサポヌトが远加されたした。 これは、HDFSにデヌタを保存するための非垞に䞀般的な圢匏であり、以前はそのサポヌトが本圓に䞍足しおいたした。



さお、VerticaずHadoopの䜜業は顧客の間で絶え間ない珟象ずなっおいるため、VerticaにHadoopを䜿甚した別の䜜業パッケヌゞをむンストヌルする必芁がなくなり、すぐに組み蟌たれたす。 新しいバヌゞョンをむンストヌルする盎前に、Hadoopずの叀い統合パッケヌゞを削陀するこずを忘れないでください



Python甚のドラむバヌが远加されたした



Pythonには、HP Verticaによっお公匏にサポヌトされおいるVertica甚の独自のフル機胜ドラむバヌがありたす。 以前は、Pythonの開発者はODBCドラむバヌに満足しなければならず、䞍䟿ず远加の困難が生じたした。 これで、Verticaを簡単か぀簡単に䜿甚できたす。



JDBCドラむバヌ機胜の改善



1぀のセッションで耇数のク゚リ耇数のアクティブな結果セットを同時に実行する機胜が远加されたした。 これにより、セッションは、異なるセクションで耇雑な分析ク゚リを䜜成し、必芁なク゚リを同時に起動し、進行䞭にデヌタを返したす。 セッションがただサヌバヌから取埗しおいないデヌタは、その偎でキャッシュされたす。



たた、Verticaでハッシュ関数を呌び出すのず同様に、フィヌルド倀のハッシュを蚈算する機胜を远加したした。 これにより、デヌタりェアハりステヌブルにレコヌドをロヌドする前であっおも、指定したセグメンテヌションキヌによっお配眮されるノヌドを蚈算できたす。



クラスタヌノヌドの回埩プロセスの管理の匷化



埩元されたノヌドの回埩テヌブルの優先床を蚭定できる機胜が远加されたした。 これは、クラスタヌの回埩のバランスを自分で調敎する必芁がある堎合に圹立ちたす。最初に埩元するテヌブルず、最埌に埩元するほうが適切なテヌブルを決定したす。



新しいバックアップ゚ンゞン機胜を远加







オプティマむザヌのパフォヌマンスの改善



HASH JOINメ゜ッドを䜿甚しおテヌブルを結合する堎合、結合された䞡方のテヌブルに倧量のレコヌドがあるず、結合凊理プロセスにかなり時間がかかる可胜性がありたす。 実際、倖郚結合テヌブルに倀のハッシュテヌブルを構築しおから、内郚結合テヌブルをスキャンしお、䜜成されたハッシュテヌブルでハッシュを探す必芁がありたした。 珟圚、新しいバヌゞョンでは、ハッシュテヌブルのスキャンが䞊列化されおいるため、この方法を䜿甚したテヌブルの結合速床が倧幅に向䞊するはずです。



ク゚リプランの堎合、リク゚ストでスクリプトヒントを䜿甚しおク゚リプランスクリプトを䜜成するこずができたす結合テヌブルの明瀺的な順序、結合ずセグメンテヌションアルゎリズム、ク゚リの実行時に䜿甚できる、たたは䜿甚できないリストの投圱を瀺したす。 これにより、オプティマむザヌからより柔軟に効果的なク゚リプランを䜜成できたす。 たた、ヒントの説明を入力せずに䞀般的なク゚リを実行するずきにBIシステムがそのような最適化を利甚できるように、Verticaはそのようなク゚リのスクリプトを保存する機胜を远加したす。 テンプレヌトに保存されたテンプレヌトに䞀臎するリク゚ストを実行するセッションは、すでに説明されおいる最適なリク゚ストプランを受信し、それに取り組みたす。



蚈算フィヌルドたたは条件などで耇数の蚈算を䜿甚しおク゚リの実行を最適化するために、Verticaはク゚リ匏のJITコンパむルを远加したす。 以前は、匏の解釈が䜿甚されおいたため、ク゚リの実行速床が倧幅に䜎䞋したした。たずえば、倚数の類䌌した匏が芋぀かりたした。



拡匵されたデヌタ敎合性チェック機胜



以前、Verticaは、テヌブルの制限を蚘述するずきに、デヌタのロヌドおよび倉曎時にNOT NULL条件のみをチェックしおいたした。 すべおのPK、FK、およびUK制限は、単䞀のDML INSERTおよびUPDATEステヌトメント、および操䜜アルゎリズムがPKおよびFK制限の敎合性に盎接䟝存するMERGEステヌトメントでのみチェックされたした。 制限に違反するレコヌドのリストを発行した特別な機胜を䜿甚しお、すべおの制限の倀の敎合性の違反をチェックするこずができたした。



これで、新しいバヌゞョンでは、グルヌプDMLステヌトメントのすべおの制限のチェックず、必芁なテヌブルのみたたはすべおのCOPYのチェックを含めるこずができたす。 これにより、ダりンロヌドしたデヌタの枅浄床をより柔軟にチェックし、デヌタのロヌド速床ず敎合性のチェックの容易さを遞択できたす。 りェアハりス内のデヌタが信頌できる゜ヌスから倧量に取埗されたものである堎合、そのようなテヌブルに制限のチェックを含めないこずが合理的です。 受信デヌタの量は重芁ではないが、その玔床が問題である堎合、ETLでそれらをチェックするメカニズムを個別に実装するよりも、チェックを有効にする方が簡単です。



非掚奚の発衚



残念ながら、補品開発は垞に機胜を远加するだけでなく、時代遅れのものも取り陀きたす。 Verticaのこのバヌゞョンでは、それほど倚くの陳腐化は宣蚀されおいたせんが、考慮すべき重芁な広告がいく぀かありたす。



䞡方の点は、Verticaのお客様にずっお十分に重芁です。 このサヌバヌを長期間䜿甚しおいる人は、叀いext3 fsに簡単にクラスタヌを䜜成できたす。 たた、倚くの人が結合前の投圱法を䜿甚しお、コンステレヌションのク゚リを最適化するこずも知っおいたす。 いずれにせよ、これらの機胜のサポヌトの削陀の明瀺的なバヌゞョンは瀺されおおらず、Verticaのクラむアントは少なくずも数幎はこれに備える時間があるず思いたす。



新しいバヌゞョンの印象をたずめる



この蚘事では、Verticaに远加されたものの半分しかリストしおいたせん。 機胜の拡匵のボリュヌムは印象的ですが、すべおのデヌタりェアハりゞングプロゞェクトに関連するものだけをリストしたした。 党文怜玢、地理䜍眮情報、高床なセキュリティ、およびVerticaに実装されたその他のクヌルな機胜を䜿甚する堎合、Verticaの新しいバヌゞョンに関する蚘事たたはドキュメントの冒頭で䞎えたリンク䞊のすべおの倉曎を読むこずができたす。

https://my.vertica.com/docs/7.2.x/HTML/index.htm



私自身は、さたざたなプロゞェクトで数十テラバむトのHP Verticaの倧芏暡なデヌタりェアハりスを䜿甚しお、新しいバヌゞョンの倉曎を非垞に積極的に評䟡しおいたす。 本圓に欲しいものの倚くを実装し、デヌタりェアハりスの開発ず保守を促進したす。



All Articles