Viya、Vaya、Vaya、Vaya-「翻蚳の難しさ」、たたは新しいプラットフォヌムSAS ViyaVayaの背埌に隠されおいるもの





ネットワヌクには、数孊統蚈アルゎリズムの䜿甚方法、ニュヌラルネットワヌク、および䞀般的な機械孊習の利点に関するさたざたな蚘事が倚数ありたす。 これらの分野は、人間の生掻の倧幅な改善ずロボットの明るい未来に貢献しおいたす。 たずえば、人間の介入や自動操瞊装眮なしで完党たたは郚分的に機胜できる新䞖代のプラント。





開発者は、これらのアプロヌチず機械孊習方法の組み合わせをさたざたな方向に組み合わせたす。 これらの゚リアには、その埌、オリゞナルではなく非垞に名前が付けられたす。たずえば、IOTモノのむンタヌネット、WOTモノのりェブ、むンダストリヌ4.0むンダストリヌ4.0、人工知胜AIなどです。 これらの抂念は、その説明がトップレベルであるずいう事実、぀たり、特定のツヌルやテクノロゞヌが考慮されおおらず、システムを実装する準備もできおいないずいう事実によっお結ばれおいたす。䞻な目暙は、目的の結果を芖芚化するこずです。 しかし、テクノロゞヌはすでに存圚したすが、倚くの堎合、単䞀のプラットフォヌムはありたせん。

この゜リュヌションは、SAS、SAP、Oracle、IBMなどの倧手゜フトりェアベンダヌず、倧䌁業ずの競争が激しい小芏暡な新興䌁業、およびオヌプン゜ヌス゜リュヌションオヌプン゜ヌス゜リュヌションの䞡方によっお提䟛されたす。 この倚様性はすべお、タスクの迅速か぀効果的な実装を倧幅に耇雑化したす。それは、さたざたなシステム同士の面倒な統合、機械孊習の優れたモデルを䜜成する開発者の倚倧な努力、およびこれらの゜リュヌションの生産的な方法での将来の実装を必芁ずするためです しかし同時に、ビゞネスを行うための䌚瀟のアプロヌチを倉えるむノベヌションプロゞェクトの成功の䞻な基準は、しばしば成功ず゜ルベンシヌの迅速な蚌明を必芁ずしたす。さもなければ、誰もそれを立ち䞊げるこずを敢えおしたせん。 そしお、これは単䞀のプラットフォヌムを䜿甚しないず䞍可胜であり、デヌタの準備怜玢、収集、クリヌニング、統合の党サむクルを迅速に完了し、高品質の分析機械孊習アルゎリズムの䜿甚を含むの圢で最終結果を取埗し、結果ずしお利益を埗るこずができたす䌚瀟のために。







SASに぀いお



SASは、高床な分析゜リュヌションの垂堎で高い地䜍にあるこずに倚くの人が同意するかもしれたせん 。 SAS゜リュヌションのレビュヌは異なる堎合がありたすが、無関心な人はいたせん。これは、ロシアおよび䞖界の倚数の顧客の存圚によっお確認されおいたす。 瀟内で簡単か぀迅速に実装し、すぐに結果を埗るこずができる既補のアルゎリズムずモデルのおかげです。 これに぀いおは、SASのブログの最初の蚘事で倚くのこずが曞かれおいたす 。 ここで読むこずができたす 。 この蚘事では、SASの成功の背景ずその歎史に぀いお説明したす。 しかし、ITずビゞネスコミュニティは急速に発展しおおり、ツヌルに察する芁求が厳しくなっおいるため、SASは新しい分析プラットフォヌムであるSAS Viyaをリリヌスしたした。 このプラットフォヌムには、高床な分析のための゜リュヌションのクラスの珟圚の傟向を刀断するために、SASが珟圚に至るたでにSASによっお䜜成されたすべおのベストが含たれおいたす。 矎しい名前ず定矩に戻るず、SAS Viyaは、分散クラりドコンピュヌティングずマむクロサヌビスアヌキテクチャのアプロヌチを䜿甚しお開発された、むンメモリ機胜を䜿甚したセルフサヌビスデヌタサむ゚ンスなどの方向性のための統合プラットフォヌムを提䟛したす。 そのため、この蚘事ではSAS Viyaプラットフォヌムに関する䞀連の蚘事を開き、Viyaが䜕であるか、䜕ができるか、そしおどのように䜿甚するかを敎理したす。







難しい遞択



垂堎には、有名なベンダヌや小芏暡なプレヌダヌの補品が非垞に倚くあり、ビゞネスのあらゆる分野でさたざたな分析䞊の問題を解決できるオヌプン゜ヌスがあるこずがすでにわかっおいたす。 特定のプラットフォヌムの遞択を決定する際に、䟡栌に加えおどのような基準を考慮する必芁がありたすか

















そもそも、ビゞネスナヌザヌは分析サむクル党䜓にたすたす関䞎するようになり、ITからのより倧きな独立性が必芁になっおいたす。 これらのナヌザヌが理解できる基準-䜿いやすさ単䞀のむンタヌフェむス、新しいシステムの孊習の最小化コヌドが少なく、グラフィックスが倚い、パフォヌマンス分析の芳点-これは倧芏暡なデヌタセットで迅速に結果を取埗できる機胜、既成のアルゎリズムずモデルの可甚性仕事のため。 黒い画面の時間がなくなり、端末りィンドりは別の圢匏ですが、ただ利甚可胜であり、倖出先でコヌドを蚘述しおデバッグするこずができたすが、ほずんどの機胜はグラフィカルむンタヌフェむスのブロックずしお既に実装でき、すべおのナヌザヌに門戞を開きたす高床な分析を䜿甚するためのレベル数孊を理解するこずは䟝然ずしお望たしいですが。





必然的に垂堎を埁服する2番目の傟向は、クラりドテクノロゞヌです。 䌁業の芳点から芋るず、これはあらゆるプロゞェクトで利甚可胜なリ゜ヌスを柔軟に管理する機䌚です。 クラりドテクノロゞヌが埓来の゜リュヌションに完党に取っお代わった時期に぀いおは、倚くの研究がありたす。 ただし、ここで重芁なのは、クラりドコンピュヌティングは倖郚デヌタセンタヌのどこか遠くにあるハヌドりェアであるだけでなく、耇雑なITむンフラストラクチャを構築たたは再構築する必芁なく、迅速に取埗できるサヌビスの圢であらゆる皮類のサヌビスを柔軟に提䟛するずいうアプロヌチでもあるこずを理解するこずです。

もう1぀の傟向は、ビッグデヌタテクノロゞヌの䜿甚です。 たた、独自の蚀語ずテクノロゞヌを備えたHadoop゚コシステム党䜓の䜿甚、およびR、Pythonなどのデヌタを操䜜するためのむンタヌフェむスを提䟛する他の利甚可胜なオヌプン゜ヌスシステム。 この分野で競争する意味はありたせんが、この゚コシステムず統合するための技術があるこずは理にかなっおいたす。 たたは、単に統合するだけでなく、SAS Hadoop Embedded Processの堎合のようにこの゚コシステムの機胜を䜿甚するか、Kafkaを䜿甚しおESPSAS Event Stream Processingシステムの高可甚性を構築したす。 たた、SAS ViyaのCAS゚ンゞンでRコヌドを実行する機胜など、改善および高速化するこずもありたす。







ナニバヌサルプラットフォヌム



需芁は䟛絊を生み出し、SAS Viyaもこのルヌルの䟋倖ではありたせん。 2016幎のグロヌバルSASフォヌラムでの発衚の際にJim Goodnightによっお䞎えられたSAS Viyaの公匏定矩を参照するず非垞に瞮小されたすが、意味は保持されたす、SAS Viyaは次のようになりたす「 分散コンピュヌティングアプロヌチを䜿甚するクラりドシステム...統合分析プラットフォヌム





SAS Viyaプラットフォヌムのアむデアず目暙を簡単に説明するず、これは、デヌタ準備から耇雑な機械孊習アルゎリズムの䜿甚たで、プロゞェクトのすべおの段階であらゆるタむプの分析を行うための普遍的なプラットフォヌムです。 4぀のタスクブロックがありたす。

1.デヌタの準備

2.デヌタの芖芚化ず研究

3.予枬分析

4.機械孊習アルゎリズムの圢匏の高床な分析



















読者向けの情報



重芁なニュアンスを損なうこずなく、1぀の蚘事のフレヌムワヌク内ですべおを䌝えるこずはかなり難しいため、これらの手順は、䟋によっお以䞋の蚘事で怜蚎されたす。 この蚘事では、分析ツヌルの迅速な䜜業を提䟛するSAS Viya゚ンゞンの重芁なトピックを怜蚎したす。 次に、モダンで矎しいむンタヌフェヌスに関する蚘事が続きたす。













SAS Viyaプラットフォヌムの基瀎



SAS Viyaには、開始するためのいく぀かの重芁な機胜がありたす。 SAS゜リュヌションを䜿甚したこずがある人は、SASが゚ンゞンで分析タスクを実行する特別な分析蚀語SAS Baseに基づいおいるこずを知っおいたす。 クラスタたたは1台の匷力なコンピュヌティングマシン䞊のグリッド構成で䜿甚できたす。 SAS Viyaず埓来のSAS 9分析゜リュヌションの䞻な違いは、SAS Viyaは新しい独自のCASクラりド分析サヌビスデヌタ凊理゚ンゞンに基づいおいたす。 2぀の重芁な機胜1぀目は、RAM内のデヌタを䜿甚しおすべおの操䜜を実行するむンメモリテクノロゞヌであり、2぀目は分散コンピュヌティングアプロヌチです。 CASは単䞀のホストで実行できたすが、マシンのクラスタヌコントロヌラヌずデヌタ凊理サヌバヌでの䜜業に最適化されおおり、クラスタヌの異なるノヌドでデヌタを保存および凊理しお負荷を䞊列化できたす抂念的なアプロヌチはHadoopシステムの抂念に非垞に近い。 図にCASアヌキテクチャを衚瀺するず、MPPたたはSMPのむンストヌルに぀いお次の図が衚瀺されたす。









なぜクラりドなのか



SASは、Viyaプラットフォヌム、特にCASの開発時に、クラりドコンピュヌティングの抂念を掻甚したした。 それらは4぀のグルヌプに分けるこずができたす

1.さたざたなクラむアントの倚数のAPIセットを介したアクセシビリティ。 SASにずっお、これは倧きな前進です。 分析にSAS Base蚀語のみを䜿甚するこずに察する制限はありたせん。 Pythonたずえば、Jupiter Notebookから、R、Luaなどを䜿甚できたす。これらは、SAS Viyaプラットフォヌム䞊のCASで実行されたす。

2.匟力性。 CASクラスタヌのノヌドを接続/切断するこずにより、システムを簡単に拡匵できたす。 アプリケヌションはWeb経由でアクセスでき、マむクロサヌビスずしお線成されたす。 これらは、むンストヌル、曎新、および操䜜の点で互いに独立しおいたす。

3.高可甚性。 CASは、クラスタヌノヌド間でデヌタミラヌリングシステムを䜿甚したす。 1぀のデヌタセットが耇数のノヌドに保存されるため、デヌタ損倱のリスクが軜枛されたす。 ノヌドの1぀に障害が発生した堎合の切り替えは、タスクのステヌタスを維持しながら自動的に行われたす。これは、倚くの堎合、倧量の分析蚈算にずっお重芁です。

4.セキュリティの向䞊。 クラりドは公共プロバむダヌから取埗できるため、実装はデヌタ䌝送チャネルの信頌性に関するより厳しい芁件を満たす必芁がありたす。

Viyaプラットフォヌムは、クラりド内、独自のデヌタセンタヌ内の専甚マシン、任意の数のマシンのクラスタヌなど、どこにでも展開できたす。 ゜リュヌションのフォヌルトトレランスは自動的に提䟛されたす。







CASはどのように機胜したすか



MPPむンストヌルの䟋を䜿甚しお、CASの動䜜を分析したす。 SMPは簡玠​​化したすが、CASの原則を維持したす。 実際には、SMPはモデルをテストするためのロヌカル環境のテストずしお䜿甚でき、パフォヌマンスを向䞊させるためにMPPプラットフォヌムに開発を移行できたす。



SAS ViyaのトップレベルCASアヌキテクチャをもう䞀床芋おみたしょう。







CASに぀いお話すず、コントロヌラヌ、別の方法でマスタヌノヌドさらにバックアップコントロヌラヌノヌドに別のノヌドを割り圓おるこずが可胜ず䜜業ノヌドで構成されたす。 マスタヌノヌドは、クラスタヌノヌドにあるデヌタに関するメタ情報を保存し、デヌタを凊理および保存するこれらのノヌドCASワヌカヌに芁求を配信したす。 別に、プラットフォヌムが動䜜するために必芁な分析サヌビスず远加モゞュヌルがあるサヌバヌが割り圓おられたす。 たた、タスクに応じおいく぀かありたす。 たずえば、SPRESAS Programming Runtime Environment甚のサヌバヌを䜿甚できたす。これにより、CASずSPREの䞡方を䜿甚するViyaプラットフォヌムで、Viyaむンストヌルの䞀郚ずしお別のマシンで埓来のSAS 9タスクを実行できたす。





ViyaプラットフォヌムでCASを䜿甚する可胜性を拡倧し、Cloudずいう名前の最初の文字を正圓化する興味深い構成がありたす。











マルチテナンシヌは、郚門間でリ゜ヌスずデヌタを共有する機胜を提䟛したす。 同時に、「テナント」には、プラットフォヌムにアクセスし、Viyaプラットフォヌムのさたざたな機胜を論理的に分離するための単䞀のむンタヌフェヌスが提䟛されたす。 倚くのオプションがありたす。 おそらく、この問題は別の蚘事で怜蚎されるでしょう。







RAMの信頌性ずCASにデヌタをロヌドする方法はどうですか



分析、特に高床な分析のための高床な゜リュヌションに぀いお話しおいるので、倧量のデヌタに぀いお話しおいるこずは明らかです。 プロセスの重芁な郚分は、RAMにデヌタをすばやくロヌドしお操䜜を実行し、このデヌタの高可甚性を確保するこずです。

信頌性のためのメモリ内システムでは、RAMにあるデヌタのバックアップが必芁です。 RAMは、電源がオフになったずきに状態を維持する方法を知りたせん。たた、すべおのデヌタがRAMの領域に収たらない堎合があり、RAMのデヌタをすばやくリロヌドするメカニズムが必芁です。 したがっお、分析のためにCASにロヌドされるテヌブルの堎合、コピヌは特別なSASHDAT圢匏の読み取り専甚メモリ領域に䜜成されたす。 高可甚性を確保するために、これらのファむルはクラスタヌ内の耇数のノヌド間でミラヌリングされたす。 このパラメヌタヌは構成できたす。 これは、ノヌドが倱われるず、SASHDATファむルのコピヌから隣接ノヌドのRAMにデヌタが自動的にロヌドされるずいう考え方です。 CAS構造内のこれらのコピヌのストレヌゞ領域はCAS_DISK_CACHEず呌ばれたす 。





CAS_DISK_CACHEはCASの重芁な郚分であり、フォヌルトトレランスを確保するためだけでなく、メモリ䜿甚量を最適化するためにも必芁です。 以䞋の図は、SASHDATを保存するさたざたな方法ず、デヌタをRAMにロヌドする原理を瀺しおいたす。 たずえば、デヌタセットAはOracleデヌタベヌスから取埗され、RAMおよびディスク䞊の単䞀のCASノヌドに保存されたす。 さらに、このデヌタセットAは別のノヌドでハヌドドラむブにのみ耇補されたす。 倚くのオプションがありたす䞀郚は远加のバックアップを必芁ずしたせん-これに぀いおは以䞋で説明したすが、䞻なアむデアは、以前にダりンロヌドしたデヌタをRAMにすばやく回埩するためのコピヌを垞に保持するこずです。 ずころで、2぀のパラメヌタヌが蚭定されおいる堎合セッションレベルでMAXTABLEMEM = 0およびCOPIES = 0の堎合、デヌタはRAMにのみ存圚したす。













たた、Hadoopを䜿甚したCASの興味深い構成を怜蚎したいず思いたす。 このCAS構成をHadoopシステムで䜿甚するには、Hadoop甚のSASプラグむンをむンストヌルする必芁がありたす。 このアプロヌチの䞻なアむデアは、Hadoopクラスタヌのノヌドも機胜するCASノヌドになるこずです。 デヌタは、ネットワヌク負荷なしでhdfsのファむルから盎接RAMに取り蟌たれたす。 これは、パフォヌマンスの面で最適なオプションです。 Hadoopは、SASHDATファむルクラスタヌ䞊のHDFSがCAS_DISK_CACHEの圹割を果たしたす-HDFSレベルでの予玄のみ、たたは他のデヌタず䞀緒に䜿甚できたす。 Hadoopクラスタヌのリ゜ヌス割り圓おは、YARNを介しお行われたす。 CASをHadoopクラスタヌにむンストヌルするスキヌム

















読み蟌み䞭



デヌタのロヌドは簡単です。 CASぞの入力のさたざたな゜ヌスを瀺すこずができたす。 これらは、単䞀のストリヌムたたは䞊行しおロヌドできたす。 リレヌショナルデヌタベヌスは゜ヌスずしお非垞に頻繁に䜿甚されるため、RDBMSからCASにデヌタをロヌドするトピックを怜蚎したす。 CASクラスタヌぞのデヌタの読み蟌みを最適化するには、クラスタヌの各ノヌドに゜ヌスデヌタベヌスのクラむアント゜フトりェアをむンストヌルするこずが望たしいです。 この堎合、CASクラスタヌの各ノヌドは、デヌタの䞀郚を䞊行しお受信したす。 クラむアントをコントロヌラヌにのみむンストヌルする堎合、すべおのデヌタはCASコントロヌラヌを介しお送信されたす。





たずえば、パラメヌタnumreadnodes = 3を蚭定するず、テヌブルは異なるCASノヌドにロヌドするためにデヌタの3぀のチャンクに自動的に分割されたす-この堎合、デヌタ分垃はmod 3操䜜を䜿甚した最初の数倀列によるグルヌプ化に基づきたす。









HadoopたたはTeradataを゜ヌスずしお䜿甚し、HadoopたたはTeradataのEmbedded Processを䜿甚するず、HadoopたたはTeradataクラスタヌの各ノヌドから盎接ロヌドが実行されたす。 Hadoopクラスタヌを個別にむンストヌルする堎合HadoopノヌドにCASはむンストヌルされない、CASクラスタヌにCAS_DISK_CACHE゚リアが䜜成されるこずに泚意しおください。

















CASを開始する方法は



CASの䜜業における重芁な甚語は、ラむブラリずセッションです。 CASでの䜜業を開始するず、最初に䜜成されるのはセッションです。 SAS Studioを䜿甚しお䜜業する堎合は手動で定矩できたす。たたは、CASに接続するず、SAS Viyaの䜿甚可胜なグラフィカルむンタヌフェむスを介しお自動的に䜜成されたす。 セッション内では、新しいラむブラリで定矩されおいるすべおのデヌタず倉換は、デフォルトでロヌカルスコヌプで䜜成されたす。 デヌタcaslibで定矩およびロヌカルセッションのステップの結果は、このセッションでのみ衚瀺されたす。 結果を公開する必芁がある堎合、caslibをグロヌバルパラメヌタずプロモヌト挔算子でオヌバヌラむドできたす。デヌタは他のセッションから利甚できたす。 グロヌバルパラメヌタですでに定矩されおいるラむブラリは、どのセッションからも利甚できたす。 これは、リ゜ヌスを最適に共有し、デヌタアクセス暩を管理するために行われたす。 ロヌカルセッションから切断した埌、caslibがグロヌバルで再定矩されおいない堎合、すべおの䞀時デヌタは削陀されたす。 TIMEOUTパラメヌタヌを蚭定しお、セッションから切断するずきにデヌタを削陀したり、短期的なネットワヌク障害䞭の損倱を回避したり、さらなる分析のためにこのセッションに戻るこずができたすたずえば、TIMEOUTパラメヌタヌを3600秒に蚭定するず、60分以内に戻りたすセッション。 さらに、デヌタは、倉換の任意のステップで、特別なSASHDAT圢匏たたはアクセスが簡単なデヌタベヌスに保存でき、単玔なSAVEオペレヌタによっお接続が蚭定されたす。





caslibsラむブラリは、CASで利甚できるデヌタセットを蚘述しおいたす。 caslibの䜜成時に、接続タむプず接続パラメヌタヌが瀺されたす。 caslibの定矩では、メモリ内のデヌタ゜ヌスずタヌゲット領域をすぐに指しおいたす。 たた、caslibレベルでは、caslibで説明されおいるデヌタぞのナヌザヌグルヌプのアクセス暩を蚭定するず䟿利です。 これは、グラフィカルむンタヌフェむスで行われたす。







さたざたなタむプの゜ヌスのcaslib蚘述の䟋







caslib caspth path="/data/cust/" type=path;  caspth –    , path -  caslib pgdvd datasource=( srctype="postgres", username="casdm", password="xxxxxx", server="sasdb.race.sas.com", database="dvdrental", schema="public", numreadnodes=3) ; caslib hivelib desc="HIVE Caslib" datasource=(SRCTYPE="HIVE",SERVER="gatekrbhdp01.gatehadoop.com", HADOOPCONFIGDIR="/opt/sas/hadoop/client_conf/", HADOOPJARPATH="/opt/sas/hadoop/client_jar/", schema="default",dfDebug=sqlinfo) GLOBAL ;
      
      







caslibを決定したら、さらに凊理するためにデヌタをRAMにロヌドできたす。 caslib hivelibデヌタをロヌドする䟋







 proc casutil; load casdata="stocks" casout="stocks" outcaslib="hivelib" incaslib="hivelib" PROMOTE ; quit; /*  casdata –  (  hive), casout –     CAS, outcaslib –  caslib,      , incaslib –  caslib,    .*/ /* in/out caslib       ,     */
      
      





各セッション内で、リク゚ストは順番に実行されたす。 これは、コヌドを手動で䜜成する堎合に重芁ですが、Viyaで䜿甚可胜なグラフィカルむンタヌフェむスを䜿甚する堎合は考えられたせん。 GUIクラむアントアプリケヌション自䜓は、ステップを䞊行しお完了するための個別のセッションを䜜成したす。









これらを操䜜するための完党にグラフィカルなむンタヌフェヌスずアプロヌチは、以䞋の蚘事で怜蚎したす。 ここで、caslib DM_ORAHRを䜜成し、GUIを介しおデヌタをRAMにロヌドする手順のスクリヌンショットを远加したす。













これはほんの始たりに過ぎたせん。



これで、CASに関するパヌトを終了し、Viyaプラットフォヌムに戻りたす。 Viyaはビゞネスナヌザヌ向けに䜜成されおいるため、䜜業の過皋でCASの詳现を深く理解する必芁はありたせん。 すべおの操䜜に䟿利なグラフィカルむンタヌフェむスがあり、CASはメモリ内および分散コンピュヌティングによるすべおの分析手順の高速操䜜を保蚌したす。







これで、Viyaで䜿甚可胜なナヌザヌむンタヌフェむスに移動できたす。 珟圚、それらの倚くがあり、補品の数は絶えず増加しおいたす。 蚘事の冒頭で、それらは完党な分析サむクルに必芁な4぀のグルヌプに割り圓おられたした。 䞻な考え方に戻るず、Viyaはデヌタマむニングず高床な分析のための単䞀のプラットフォヌムです。 そしお、䜜業はこのデヌタの準備ず怜玢から始たりたす。 たた、Viyaに関する䞀連の蚘事の次の郚分では、アナリストが利甚できるデヌタ準備ツヌルに぀いお説明したす。







結論の代わりに、Viyaずいう名前はViaずいう単語に由来しおいたす英語の「スルヌ」たたは「スルヌ」から。 この名前の䞻なアむデアは、埓来のSAS 9゜リュヌションから、分析を新しいレベルに匕き䞊げるために䜜成された新しいプラットフォヌムぞの単玔な移行です。








All Articles