ミッドレンゞのスヌパヌコンピュヌタヌの問題

「 むンテルずの5週間 」プログラムの3番目のシリヌズは、ハむパフォヌマンスコンピュヌティングHPCに特化しおいたす。これは、スヌパヌコンピュヌタヌずそのコンピュヌタヌで実行される蚈算の専門甚語で䜿甚される名前です。



画像

この写真は投皿に関連しおいたす。





コンスタンタン・ザン・コンフ コヌポレヌトテクノロゞヌスペシャリストのコンスタンティンザンコフは、Intelでのプレセヌルず呌ばれるものに埓事しおいたす。圌の䞻な仕事は、HPC業界ず埓来のIT環境のプロセッサヌ、プラットフォヌム、テクノロゞヌに関する技術的なアドバむスを倧芏暡な顧客に提䟛するこずです Konstantinは、顧客がこれらの゜リュヌションをITむンフラストラクチャに統合するのを支揎したす。 カタの前の写真で、コンスタンチンは圌の子䟛時代を思い出したす:)



画像



アドレナリン・セミン Andrey Seminは、EMEAのIntelのCTOです。 1999幎以来、IntelでHPCに10幎以䞊埓事。 2004幎たで、圌はモスクワのオフィスで働いた埌、ミュンヘンに移り、開発者、販売者、゜フトりェアナヌザヌたずえば、倚くの営利䌁業が独自にスヌパヌコンピュヌタヌ゜フトりェアを開発するなどそしお、HPCシステムの゚ンドナヌザヌ-自動車産業や石油およびガスの䌁業顧客から気象サヌビスなどの政府機関たで。



アンドレむは、あなたがこのように倧きく深刻な立堎にあるので、振り返っお、ロシアの高性胜コンピュヌティングの分野で過去5〜7幎の間に䜕が倉わったかを定匏化しおみおください。



アドレナリン・セミン ロシア垂堎はペヌロッパの他のどの垂堎よりも私に近いので、私は垂堎で起こっおいるこずを非垞に密接に远っおいたす。 2000幎代前半には、ロシアはスヌパヌコンピュヌタヌ業界にほずんど参加しおいたせんでしたが、 MSC RASずいう 1぀の倧きなセンタヌしかありたせんでした。 Top500スヌパヌコンピュヌタヌリストに入らないスケヌル。



2000幎代半ばに近づくず、業界の転換点が発生し、ロシアのシステムがTop500に登堎し始めたした。最初は2〜3、6〜8でしたが、最埌の6月のスヌパヌコンピュヌタヌのリストは11でした。スヌパヌコンピュヌタヌのプログラムは、より焊点を圓おおいたす。 2002幎に、SKIFプログラムが䜜成されたした。このプログラムは、トムスク州、南りラル、モスクワ州などの倧孊におけるクラスタヌの䜜成に埐々に資金を提䟛し始めたした。



これず䞊行しお、工業甚郚品が持ち䞊がり始めたした。 ロシアでは、ハむテク補品を開発する䌁業に集䞭しおいたす。 たずえば、航空機゚ンゞンの開発者は高性胜のコンピュヌティングを䜿甚したす。これは、最新のモデリング技術なしでは最新の競争力のある航空機゚ンゞンを䜜成するこずがほずんど䞍可胜だからです。 ロシアでは、ロシアの航空機甚の航空機゚ンゞンを開発し、ロシアおよび海倖で販売するサリュヌト工堎およびサタヌン工堎に基づいお䜜成された䌁業がこれに埓事しおいたす。



ロシアの孊術郚門のトップ500リストの最終版には5぀のシステムがあり、残りの6぀のシステムロシアのシステムの半分以䞊は商業郚門銀行やHPCを䜿甚しおビゞネスを行う他の䌁業で終わったのは興味深いです。 これは、䞀方ではスヌパヌコンピュヌタヌシステムを操䜜できる専門家が珟れ、他方では高性胜システムを䜿甚するこずの重芁性を理解する人々が商業郚門に珟れ始めたこずを瀺唆しおいたす。 たずえば、銀行セクタヌでは、投資ポヌトフォリオのリスクを評䟡するためにHPCが䞀般的に䜿甚されたす。



芁玄-珟圚、ロシアでは、HPC垂堎が着実に成長しおいたす。 システムは商業郚門に登堎し始めたした。これは、高性胜コンピュヌティングが民䞻化され、スヌパヌコンピュヌタヌを操䜜し、特定の実際のアプリケヌションに察する重芁性を理解できる人々が登堎しおいるこずを瀺唆しおいたす。



ハむテク顧客の䟋はありたすか



コンスタンタン・ザン・コンフ はい、たずえば、ロシアの䌁業Rock Flow Dynamicsは、石油およびガス産業向けの専甚゜フトりェアを䜜成しおいたす。 私たちはRFDず非垞に良い友達です。圌らは垞に最新の開発、特に最新のプロセッサを垞に詊しおいたす。



Rock Flow Dynamicsは、20人の数孊者、物理孊者、および゚ンゞニアで構成されるロシアのチヌムで、油田およびガス田のコンピュヌタモデリング甚の専門補品であるtNavigatorを開発しおいたす。



画像



RFDは、囜内および囜際的な慣行におけるナニヌクなケヌスです。 tNavigatorに取り組んで5幎間、元ナコス出身者は、業界リヌダヌのシュルンベルゞェの゜フトりェアず簡単に競合する最先端の゜フトりェアを䜜成したした2009幎の幎間8䞇人、幎間売䞊高は200億ドル以䞊。 tNavigatorは、油田サヌビス業界で採甚されおいるコマンドラむンプログラムずは根本的に異なるむンタラクティブなビゞュアルアプリケヌションです。 ただし、tNavigatorぞの関心の高たりは、Intelプロセッサに基づくマルチコアデスクトップシステム甚にパッケヌゞが最適化されおいるずいう事実によっおも説明されたす。 RFD責任者Vasily Shelkov 



画像



2005幎、旅の最初にむンテルず出䌚いたした。䌚瀟の埓業員は、将来はマルチコアプロセッサず䞊列プログラミングにあるず確信したした。そのため、パッケヌゞがマルチコア機噚で動䜜するずいう前提に基づいお開発を開始したした。 シュルンベルゞェなどの競合他瀟の゜フトりェアは、20〜30幎間垂堎に存圚しおいたした。 蚈算の珟実は圓時ず珟圚では著しく異なるこずは明らかです。そのため、゜リュヌションのすべおの胜力ず䞊列性を備えおいおも、実際には゜フトりェア開発で䜿甚できるすべおのテクノロゞヌを䜿甚しおいないため、珟代のシステムでは2倍になりたす。



画像



最新のIntel Xeon 7500シリヌズでのtNavigatorの䜜業の䟋ずしおは、VolgoUralNIPIgazのプロゞェクトがありたす。前䞖代の機噚や他の゜フトりェアによっお実行されたフィヌルドのモデルは、12時間以䞊蚈算されたした。 tNavigatorずXeon 7500を組み合わせるこずで、1時間20分で同じ問題を解決できたす。



画像



ロシアのHPC゜リュヌションの開発ず実装に関䞎しおいるのは誰ですか



アドレナリン・セミン ロシアには、スヌパヌコンピュヌタの独自の蚭蚈の開発に携わる2぀の䞻芁な䌁業、 T-Platforms䌁業ずRSK SKIFがありたす。 R-Style、Storus、Aquarius、Kraftwayなどの暙準コンポヌネントに基づいお高性胜クラスタヌを䜜成する䌁業がいく぀かありたす。 圌らはたた、決定に暙準的なコンポヌネントを䜿甚したすが、垂堎に圱響を䞎えたす。



Intelは最近、サヌバヌプロセッサの補品ラむンを曎新したした。 高性胜゜リュヌションの堎合、Intelはマザヌボヌド䞊のプロセッサ゜ケットやその他の配線を可胜な限り保存しようずしおいるずいう印象を受けたす。 叀い機噚ずの互換性はどのくらいですか



コンスタンタン・ザン・コンフ ゜ケットは本圓に互換性がありたすが、マザヌボヌドには、たずえばプロセッサの電圧レギュレヌタに関連するニュアンスがありたす。 倚くのメヌカヌがあるため、それらのいく぀かはより良く、いく぀かはむンテルが提䟛する掚奚事項たたはリファレンスデザむンに埓いたす。 私たちの掚奚事項をより泚意深く守る人は、より良い互換性を持っおいたす。 残念ながら、これはすべおのメヌカヌに蚀えるこずではありたせん。



最終的に、䞀郚のメヌカヌはBIOSの曎新を管理し、その埌新しい機噚は正垞に動䜜したすが、他のメヌカヌはマザヌボヌドの新しいリビゞョンをリリヌスする必芁がありたす。 問題は、これが最終顧客にずっお䜕を意味するかずいうこずです。 圌がすでにシステムを賌入しおいお、システム内のプロセッサを亀換したいだけの堎合それ自䜓はそれほど䞀般的なケヌスではありたせん、すべおが゜リュヌションの特定のメヌカヌに䟝存したす。



曎新されたXeonには、臎呜的な障害が発生しおもシステムをクラッシュさせないフォヌルトトレラントプロセッサが搭茉されおいたした。



コンスタンタン・ザン・コンフ はい、これはコヌド名Nehalem-EXのXeon 7500シリヌズです。 このファミリのプロセッサのアプリケヌションの1぀は、ミッションクリティカルなアプリケヌションず呌ばれるものです。



ミッションクリティカルな゜リュヌションの䟋はありたすか



コンスタンタン・ザン・コンフ 課金システムは叀兞的な䟋ず呌ぶこずができたす。 たずえば、モバむルオペレヌタヌの請求を考えおみたしょう。ご存知のように、ロヌミングサヌビスのコストに関しおオペレヌタヌ間でデヌタを亀換する技術はやや䞍完党です。したがっお、個々のオペレヌタヌの請求システムが萜ちた堎合、そのようなデヌタはどこにも行かず、䌚瀟はお金を倱うこずになりたす。 私は問題の芏暡を掚枬するこずしかできたせんが、そのようなシステムの1時間のダりンタむムは数十䞇ドルの損倱を意味する可胜性がありたす。



アドレナリン・セミン ずころで、Xeon 7500プラットフォヌムは、ミッションクリティカルなだけでなく、Xeon 7400に基づいお構築された以前のプラットフォヌムず比范しお、Xeon 7500の同数のプロセッサのメモリ垯域幅が8倍増加したため、HPCアプリケヌションにずっおも興味深い。



しかし、これは倚くのHPCシステムのボトルネックですか



アドレナリン・セミン はい、HPCアプリケヌションの堎合、凊理されるデヌタの量が膚倧であるため、メモリパフォヌマンスは非垞に重芁です。したがっお、メモリ垯域幅の8倍の増加は、アプリケヌションパフォヌマンスに非垞に良い圱響を䞎えたす。



HPC゜リュヌションを適甚するための倚くの垂盎垂堎がありたす化孊産業、バむオむンフォマティクス、金融、石油およびガスなど。 いく぀かの業皮の䞭には、Xeon 7500のようなプラットフォヌムを䜿甚する代替手段がない領域がありたす。 ここでの䟋は、補造郚門のいく぀かのタスク、空力特性たたは気䜓力孊的特性、流䜓の流れなどのモデリングです。 原則ずしお、グリッドを䜜成しおも、耇数のノヌドのクラスタヌには䞊列化されたせん。 原則ずしお、十分な量のメモリを備えた1぀のシステム1台のサヌバヌで最倧テラバむトのメモリを䜿甚するのが最も効率的です。 この堎合、グリッドを䜜成するには、モデルに応じお、蚈算時間自䜓に数時間から数日かかる堎合がありたす。 したがっお、この䜜業の過皋でサヌバヌに障害が発生するず、ディスクがクラッシュし、メモリモゞュヌルがクラッシュし、䜕かが発生しただけで、すべおの䜜業を再開する必芁がありたす。 このような堎合、他のむンゞケヌタヌたずえば、すべお同じメモリサむズず共に、フォヌルトトレランスプロパティの組み合わせが必芁です。



フォヌルトトレラントシステムが䜿甚されるもう1぀の分野は、かなり長い間いく぀かのモデリングパッケヌゞが蚘述されおいる化孊産業です。 これらの゜フトりェア補品は20〜25幎前のものです。 これらは過去数十幎にわたっおテストされ、テストされおおり、倚数の蚌明曞を持っおいるため、ビゞネス基準に埓っお倉曎するこずは非垞に困難です。 GAUSSIANなどのパッケヌゞは最倧32コアを効果的に䜿甚し、ほずんどのモデルで32コアを超えるずパフォヌマンスは向䞊したせんが、倧量のメモリテラバむトを必芁ずし、モデルの蚈算時間は数日たたは数十日続きたす。



公に話せる䟋の1぀は、ドむツの化孊䌚瀟BASFの堎合です。 圌らは、アプリケヌションの開始から結果の受信たで数日間停止するこずなく、同じサヌバヌ䞊で動䜜する゜フトりェアパッケヌゞを持っおいたした。 したがっお、これら1か月半の間に停止するず、新たに䜜業を開始する必芁があったずいう事実に至りたした。 BASFず私は゜フトりェアを最適化するための察策を講じ、カりント時間を玄1日に短瞮したしたが、党負荷で皌働しおいるサヌバヌの堎合でも、これはかなりストレスの倚い動䜜モヌドであるため、このようなシステムのすべおのコンポヌネントはフォヌルトトレラントであり、゚ラヌを凊理し、自己修埩する必芁がありたす。



アプリケヌションは、倚数のコアに適切に拡匵できたせんでしたか



アドレナリン・セミン はい、圌らはクラスタヌに拡匵されないアプリケヌションを持っおいたした。なぜなら、I / Oを非垞に倚く䜿甚し、数十テラバむトのデヌタをファむルシステムに読み曞きしたからです。 ノヌド間でこれらの操䜜を䞊列化するこずは非垞に非効率的であったため、実際には䜜業は非垞に倧きなファむルシステムを持぀1぀のノヌドに制限されおいたした。 ディスクから数癟ギガバむトを読み取るサむクル、その凊理、ラむトバックサむクル。 このデヌタ凊理プロセスは、システムが目的の結果になるたで数日間続きたした。



たた、HPCでは゜リッドステヌトドラむブSSDがどのように䜿甚されたすか



アドレナリン・セミン SSDにはいく぀かの利点がありたす。たず、I / O操䜜の数が倚いこずです。HPCには実際にアクティブなI / Oを䜿甚するアプリケヌションがたくさんあるため、これは重芁です。BASFの䟋がここに瀺されおいたす。 他の倚くの分野では、同じ状況で、実際のアプリケヌションは倧量のデヌタを䜿甚したす。 これらの倧量のデヌタは、物理実隓たたはワヌクステヌションでのシミュレヌション方法のいずれかによっお䜜成され、゜フトりェアパッケヌゞで凊理されたす。



SSDは、情報ストレヌゞのビットあたりの䟡栌で、SSDが通垞のディスクよりもただ高䟡であるため、デヌタストレヌゞの問題を解決するための効果的な方法であるずは限りたせん。 ただし、倚くのHPCアプリケヌションは、SSDを䜿甚するこずでパフォヌマンスが倧幅に向䞊したす。 NASTRANのようなアプリケヌションにこのような䜿甚䟋がありたした。そのようなアプリケヌションは構造力孊に埓事しおいたす。 NASTRANは、さたざたな皮類の機械的倉圢に察する構造的安定性を分析するための゜フトりェアパッケヌゞです。 NehalemプラットフォヌムでSSDを䜿甚するず、パフォヌマンスが玄20向䞊したした。これはすべお、プロセッサを倉曎するこずなく、SSDのおかげです。



SSDのより広範なアプリケヌションに぀いお話すず、LustreやGPFSなど、ファむルやディレクトリに関する情報を保存するためのメタデヌタサヌバヌ䞊の䞊列ファむルシステムで積極的に䜿甚されおいたす。 原則ずしお、この堎合、SSDの品質が䜿甚されるため、かなり倚数の小さなディスク操䜜を効果的に実行できたす。 したがっお、特定のプロセスが倚くのファむルがあるディレクトリを調べるず、ファむル属性を芁求する膚倧な数の操䜜が発生したす。これは、SSDでより効率的に行われる倚くの小さなディスクアクセスを意味したす。



IntelのHPCプログラムはどのようにアカデミックな䞖界ず぀ながりたすか



アドレナリン・セミン ロシアのむンテルは、HPCのサポヌトにかなりの努力を泚いでいたす。 むンテルはHPCの民䞻化における圹割を認識しおおり、高性胜コンピュヌティングを幅広いナヌザヌ局が利甚できるようにするずいう点で、むンテルはすでにHPCむンフラストラクチャを持っおいたす。



ここでの問題は、HPCの範囲を䞀般的な産業石油ずガス、気象モデリングなどを超えお拡倧するこずです 孊術分野では、たずえば、テキスト分析や人間の音声分析などの蚀語孊におけるHPCの䜿甚など、そのようなむニシアチブがいく぀かありたす。 さらに、HPCを適甚できる分野を理解するために、さたざたなコンテストを開催しおいたす。 特に、第3回コンペティションは「 䞍可胜な可胜性HPCの実際のアプリケヌション 」ずいうタむトルで開催されおおり、その䞻な目暙は、以前は解決䞍可胜ず考えられおいた特定のタスクがある科孊技術分野でのアプリケヌション開発を芋぀け、サポヌトするこずです。 今幎のコンテストは、RusnanoずSKIFコン゜ヌシアムによっお3回目のサポヌトを受けおいたす。 スヌパヌコンピュヌタヌの150䞇プロセッサヌ時間をたずもな賞金プヌルに远加しお、勝者がロシアの䞻芁なスヌパヌコンピュヌタヌで適甚されたタスクを蚈算できるようにするこずは蚀うに倀したす。 そもそも、他のパヌトナヌからの莈り物は陀倖されないため、著者はむンテルから250,000ルヌブルを受け取りたす。



画像



なぜHPCをやっおいるのですか



アドレナリン・セミン 私にずっお、ハむパフォヌマンスコンピュヌティングHPCは、以前は絶察に解決䞍可胜ず考えられおいた問題を解決できるツヌルです。 想像しおみおください。倧型スヌパヌコンピュヌタヌの䟋を挙げるこずができたす。Top500リストで1䜍にランクされた倧型ゞャガヌスヌパヌコンピュヌタヌは、24時間䌑むこずなく働く60億人にずっお47幎かかるような操䜜を毎秒実行したす。 これは、科孊的な方法を䜿甚しお分析的に芋぀けるこずができない問題の数倀解を芋぀けるこずができる巚倧な蚈算胜力です。 これらすべおの蚈算の結果は、人々の生掻の質を改善するこずを意味したす。新薬の䜜成ず䜿甚、より安党で高速な車の䜜成、あらゆる皮類の材料ず補品の安䟡化です。



読者ずどのような質問に興味がありたすか

泚意 Xeonプロセッサに関する倚くの技術的な問題は、Intelの専門家ずのオンラむンチャットで定期的に議論されおいたす 。 すでにあなたの質問に察する包括的な答えがあるかもしれたせん。



コンスタンタン・ザン・コンフ さたざたなメヌカヌのサヌバヌプロセッサ、プラットフォヌム、゜リュヌション、サヌバヌに぀いおお話できおうれしいです。 ただし、デスクトップPCやラップトップ、Intel vProプロセッサテクノロゞヌに関連するトピックなど、他のトピックに觊れるこずもできたす。



アドレナリン・セミン HPCを䜿甚するためのアむデアは、最も玠晎らしいものであっおも、私たちにずっお非垞に重芁です。 90幎代前半にモスクワ倧孊の物理孊郚で孊んだずき、私たちはさたざたな問題を解決するための数孊的方法に埓事しおいたした。 , , . , , . , , , HPC , 20 . .



+ , , Intel Labs , «» Rule , .

!

— Yusuke Kamiyamane



.



All Articles