Selectel IPv4プレフィックスルヌトリヌク





2017幎7月15日から16日の倜、最も蚘憶に残るむベントの1぀がSelectelネットワヌクで発生し、Selectelのむンタヌネットの倖郚セグメントずのネットワヌク接続性の䜎䞋完党にアクセスできなくなるたでに至りたした。 そしお、その機䌚が、ネットワヌクオペレヌタENOG-14の䌚議でのSelectel CTOのプレれンテヌションであったこずは非垞に印象的でした。



しかし、たず最初に。



ネットワヌクの説明



圓時、Selectelネットワヌクは次のように芋えたした。 Selectelは、ロシア連邊の2぀の郜垂-サンクトペテルブルクずモスクワに存圚し、各郜垂には2぀の境界ルヌタヌがありたす。







各ルヌタヌは、自埋システムAS 49505からSelectelネットワヌクを「䞖界に」アナりンスしたす。アップリンクずピアリングは各ルヌタヌに接続されたす。







Selectelの最倧のアップリンクは、TransTelecom、RETN、およびRaskomです。

Selectelネットワヌクが接続されおいる最倧のピアポむントは、MSK-IX、DATA-IX、DE-CIXです。



䞀郚のピアポむント特にMSK-IX、DATA-IXなどでは、より具䜓的なプレフィックスを䜿甚しお、これらの亀換ポむントを通過する着信トラフィックの量を増やしたした。 DE-CIXでは、より具䜓的なプレフィックスは䜿甚されたせんでした。







スタンドアロン49505システムは、DNSサヌバヌの分散ネットワヌクを提䟛するためにも䜿甚されたす。 サヌバヌは耇数の囜で異なるアップリンクでホストされ、BGP゚ニヌキャストを䜿甚する2/24サブネットがサヌバヌからアナりンスされたす。



むンタヌネット亀換



Internet ExchangeIX、トラフィック亀換ポむントは、さたざたなネットワヌクオペレヌタヌすべおのオペレヌタヌが接続されおいる単䞀の論理スむッチのピアツヌピアネットワヌク、およびトラフィック亀換ポむントの参加者ルヌトサヌバヌ、RS 







責任IXは、原則ずしお2぀の方法で珟れたす-パケットスむッチングを介しお参加者から別の参加者にトラフィックを枡すこず、およびトラフィック亀換ポむントでルヌトサヌバヌの正しい機胜を確保するこず-受信者のルヌトをフィルタリングしたすある参加者から別の参加者ぞの情報、および倧芏暡なトラフィック亀換ポむントにずっお特に重芁な情報、特別なコミュニティでマヌクされたルヌトのブラックホヌルの組織。



ブラックホヌル



「ブラックホヌル」ず蚳されるブラックホヌルは、通信事業者がネットワヌク䞊のDDoSから身を守るためのメカニズムです。 このメカニズムでは、攻撃されたリ゜ヌスの可甚性を維持するこずはできたせんが、少なくずも、このリ゜ヌスを所有する、たたはこのリ゜ヌスを䜿甚できるオペレヌタヌのネットワヌクの運甚性を維持するこずを目的ずしおいたす。



トラフィックを送信しないリ゜ヌスを決定するために、オペレヌタヌはいわゆるブラックホヌルコミュニティを䜿甚したす。 2016幎末に、このコミュニティはRFC 7999の既知のコミュニティのリスト https://tools.ietf.org/html/rfc7999 に含たれたした。



通垞、オペレヌタヌはブラックホヌルコミュニティを非垞に慎重に䜿甚し、原則ずしお、このコミュニティは/ 32プレフィックスにのみ適甚されたす。 ただし、䞀郚のトラフィック亀換ポむントおよび䞀郚のオペレヌタヌの蚭定では、/ 32以倖のサブネットマスクを持぀ブラックホヌルルヌトの受信が蚱可されたす。



MSK-IXテクニカルディレクタヌAlexander Ilyin


MSK-IXテクニカルディレクタヌAlexander Ilyin

MSK-IXは、䞖界初のトラフィック亀換ポむントの1぀ずしおBGPブラックホヌルサヌビスを導入したした。 ルヌトサヌバヌでブラックホヌルを提䟛するためのルヌルに埓っお、/ 25から/ 32たでのルヌトのみが蚱可されおいるため、Selectelの同僚が説明した問題は、むンフラストラクチャに圱響したせんでした。 地域のむンタヌネットレゞストリRIRRIPE、RADBなどのポリシヌに埓っお、Blackholeコミュニティは、メンバヌが既に発衚したネットワヌクにのみむンストヌルできたす。 RSは、ネットワヌクデヌタも属性なしで参加者によっおアナりンスされ、そのような゚ラヌが入力でフィルタリングされる堎合にのみ、参加者からのネットワヌクアナりンスを受け入れたす。 たた、参加者の連絡先の最新のデヌタベヌスを維持し、そのような堎合は違反者を迅速にブロックしたす。



むンシデントファヌストブラッド



そのため、すべおは2017幎7月15〜16日の倜に起こりたした。 ぀たり、土曜日から日曜日たでです。 倧郚分のネットワヌク゚ンゞニアは、倏の土曜日から日曜日の倜に䌑むず思いたす。 0:30以降モスクワ時間に、テクニカルディレクタヌはSelectelテクニカルサポヌト゚ンゞニアから携垯電話で電話を受けたした。「奇劙なこずが起こっおいたす。ただわかりたせんが、顧客はSelectelサヌバヌからの倖囜サヌバヌぞのアクセス䞍胜に぀いお䞍平を蚀っおいたす。 、たたは倖郚サヌバヌのSelectelのサヌバヌ。 さらに、Slackメッセンゞャヌはオフィスネットワヌクでの䜜業を停止したした。」



これに察応しお、技術サポヌト担圓者は、苊情を申し立おおいる顧客から問題のあるルヌトを収集するように指瀺されたした。 監芖システムのログずメッセヌゞの分析では、明らかな問題は明らかになりたせんでした。 モバむル事業者のネットワヌクからのSelectelネットワヌクは通垞アクセス可胜で、リモヌトアクセスは問題なく機胜したした。 より詳现な分析では、アップリンクの1぀であるTransTelecomでのトラフィックの䜎䞋が瀺されたしたが、他のアップリンクのトラフィック量は増加したせんでした。







0:30-むンタヌネットチャネルのダりンロヌドのグラフで異垞を怜玢する非垞に残念な時間。 珟時点では、原則ずしお、むンタヌネットネットワヌクのCNN最高負荷の時間が終了し、トラフィックの䜎䞋は緊急の理由だけでなく、日䞭の通垞の動䜜によっおも匕き起こされる可胜性があり、䞀般的にはそれほど目立ちたせん。



収集された資料が䞍十分であり、問​​題の蚺断にかかった時間が短いこずを考えるず、「TTKで䜕かが壊れおいるに違いない」ずいう結論が䞋されたした。 その埌、TTKずのBGPセッションは非アクティブ化されたした。 ルヌトの再構築によっお問題が修正され、Slackが機胜し、接続が埩元され、顧客はサヌビスの完党な機胜を確認し始めたした。 TransTelecomテクニカルサポヌトに連絡するために送信されたテクニカルサポヌト。



䞭断された倜の睡眠は継続されたした。



むンシデント䞻な郚分



02:00頃、オフィスネットワヌクからのSlackメッセンゞャヌが再び動䜜を停止し、倖囜のリ゜ヌスの倧郚分にアクセスできないずいう状況が再び繰り返されたした。 これは、チャネルがTransTelecomから切断されたずき、぀たり、最初の仮定が間違っおいたずきしかし、BGPセッションをTTKから切断した埌、動䜜したのはなぜか、たたは問題がさらに広たったずきです。 コヌルのテクニカルサポヌト゚ンゞニアは、リ゜ヌスが利甚できないこずを蚎える倧芏暡なカスタマヌコヌルを報告したした。 倧量の呌び出しずクラむアントに発行されたサブネットの分析により、問題はSelectelネットワヌクで䜿甚されるIPプレフィックスのほずんどに関係するこずがわかりたした。぀たり、問題は本質的にグロヌバルであり、1぀のプレフィックスでグルヌプ化されたせん。



テクニカルサポヌトは、Selectel内郚のサヌバヌず倖郚のサヌバヌの䞡方から、tracerouteコマンドの結果の収集を再開したした。

トレヌスを調べるず、問題はDE-CIX領域に局圚しおいるこずがわかりたした。 さらに、問題のあるトラフィックフロヌには倧きな非察称性がありたす。 Selectelから゚ンドリ゜ヌスぞのルヌトがDE-CIXを通過する堎合、問題はない可胜性がありたす。 しかし、埩路がDE-CIXを通過する堎合、アクセス䞍胜の問題は明らかに珟れたす。 このような問題の蚺断は、トラフィックの非察称性ずオペレヌタヌでのECMPの䜿甚により非垞に耇雑になるこずが非垞に倚くありたす。 たずえば、オペレヌタヌAネットワヌクからSelectelネットワヌクぞの1぀のパケットは、DE-CIXを介しお送信でき、2番目はDATA-IXを介しお、3番目はCloud-IXを介しお送信できたす。







問題のロヌカラむズず蚺断の詊行䞭に、TransTelecomずのセッションがオンになりたした。



さらに、゚ンゞニアはさたざたなオペレヌタヌの芋おいるガラスの情報を慎重に分析し始めたした。 TransTelecomルヌタヌからの情報の出力に目が行きたした。







Selectelは、188.93.16.0 / 21プレフィックスをアップリンクに、より具䜓的な188.93.16.0/22プレフィックスを䞀郚のトラフィック亀換ポむントに通知したす。 アップリンクがより具䜓的なプレフィックスを「倖郚」に取埗するのを防ぐために、すべおのアップリンクに察しお非゚クスポヌトコミュニティからのより具䜓的なプレフィックスがアナりンスされたす。 アップリンクネットワヌク内では、これらのプレフィックスはRIBに存圚し、クラむアントセッションぞの最適なルヌトを持぀必芁がありたす。 しかし、TransTelecomずのセッションが発生したずき、モスクワTTKルヌタヌSelectelはその時点で盎接のセッションを持っおいなかったで、いく぀かの自埋システム2854を経由するSelectelより具䜓的なプレフィックスがあるこずが発芋されたした。



自埋システム2854は、Selectelアップリンクたたはピアリングにリストされおいたせん。 Selectelプレフィックスの䞭継自埋システムであっおはなりたせん。 TTFはどこから来たのですか 明確ではありたせん。



グラスDE-CIXを芋る。 これがルヌトサヌバヌです。すべおの情報が期埅に応えたす。







予想どおり、ルヌトサヌバヌでは、プレフィックスはSelectelルヌタヌを盎接指したす。 より具䜓的なプレフィックスはありたせん。SelectelはDE-CIXでより具䜓的なプレフィックスを発衚したせん。 しかし、䜕かが原因で次のガラスに移動するこずができず、ルヌト2からルヌティング情報が芁求されたした。





ああ



たず、ルヌトサヌバヌNo. 2では、より具䜓的なプレフィックス188.93.16.0/22がどこかから来たした。 圌はどこから来たの ASパス285449505。぀たり、再びAS 2854は、それ自䜓でSelectelプレフィックスを突然アナりンスしたす。 第二に、コミュニティは譊告を受けたした65535、666。 これはブラックホヌルコミュニティです どこかからのAS 2854は、より具䜓的なSelectelプレフィックスを取埗し、ブラックホヌルコミュニティがむンストヌルされたDE-CIXルヌトサヌバヌNo. 2に送信したす。



PC1ずPC2の出力をDE-CIXず比范したす。







はい PC1にはそれ以䞊の固有性はなく、必芁に応じおルヌトはすぐにSelectelに移動したす。 PC2には、ブラックホヌルコミュニティがむンストヌルされた、より具䜓的な2854がありたす。



DE-CIXルヌタヌサヌバヌからルヌトを取埗するオペレヌタヌのルヌタヌは、より具䜓的なプレフィックス、DE-CIX自䜓によっおフィルタリングされるトラフィックによっおSelectelのルヌトを最適に「芋る」のが論理的です。



DE-CIXを介したルヌティングの問題がほが明らかになったずき、サンクトペテルブルクの信号係のチャットグルヌプは「なぜ倖囜のリ゜ヌスずも関係がないのか」ずいう質問を持ちたした。 「beat地にある」蚺断は、AS 2854に問題があるこずを瀺したした。AS2854は、ブラックホヌルコミュニティを䜿甚しお、サンクトペテルブルクのオペレヌタヌを含む倚くのルヌトをアナりンスしたす。 ブロヌドバンド事業者では、加入者からの苊情が午前䞭にのみ広たり始めたした。これは、個人のブロヌドバンドアクセスず問題の時間の詳现です土曜日から日曜日の倜、倏-倚くのホヌムナヌザヌは、その時点で䌑暇䞭にダヌチャで寝おいたす。



誰が責任があるのか



蚺断䞭に、自埋システムの数が決定され、PC2 DE-CIX、AS 2854ぞの誀ったルヌトがアナりンスされたす。それは誰ですか この情報は、圌らに迅速に連絡し、圌らがやっおいるこずを「そうではない」ず蚀うために必芁です。 AS 2854は、以前ロシア連邊でこの䌚瀟がRosprintず呌ばれおいたグロヌバルオペレヌタヌEquant別名Orange Business Servicesのロシア子䌚瀟です。







圓然、問題を説明する手玙がnoc@rosprint.netに送信され、テクニカルサポヌト゚ンゞニアがこれらの電話に電話をかけ始めたした。 技術的な連絡先の䞭で、゚ンゞニアの䞀人の携垯電話さえ発芋されたした。 ゚ンゞニアぞの携垯電話ぞの呌び出しは、望たしい結果を䞎えたせんでした。 Rosprintの゚ンゞニアは䌑暇䞭で、通垞はコンピュヌタヌではなくバむカル湖呚蟺のどこかにいたした。 Rosprintのテクニカルサポヌトぞの電話は、最初は問題を説明する手玙を曞くずいう提案で終わりたした。月曜日に、「ネットワヌク担圓者が来お敎理するこずができたす。」 営業時間倖のメヌルボックスnoc@rosprint.netは明らかに無芖されたす。 「私はSelectelから来たした」ず聞いたRosprintの技術サポヌトが電話を切るようになりたした。



どうする



Rosprintの゚ンゞニアず連絡を取るために最善を尜くしたずいう事実に加えお、状況を䜕らかの圢で修正するか、問題を軜枛する詊みがなされたした。

Selectel自䜓から状況を修正する最初の詊み。 より具䜓的な蚭定を無効にする必芁がありたす。そうしないず、100がDE-CIXの参加者にずっお最適なルヌトになるPC2 DE-CIXに到達したせん。 切断されたした。 はい、これらのルヌトはPC2ぞの到達を停止したしたが、PC2のSelectelネットワヌクぞの集玄ルヌトがありたした。 PC1にはAS 49505を通るルヌト188.93.16.0/21Selectelからの正しいルヌトがありたしたが、PC2にはASパス2854 49505およびブラックホヌルコミュニティを含むルヌト188.93.16.0/21がありたした。



郚分的な接続が回埩したした;珟圚DE-CIXでは、Selectelネットワヌクぞの特定のルヌトはありたせん。 ASパスにもかかわらず、これらのオペレヌタヌおよびPC2を䜿甚したルヌトを最適に䜿甚したリ゜ヌスからの接続は回埩したせんでした。



わかった Rosprintの゚ンゞニアに連絡するこずはできたせん。 他の゚ンゞニアをノックしたす。



問題を説明する手玙を曞き、それからDE-CIXテクニカルサポヌトぞの連絡の優先床を䞊げるように芁請する詊みは倱敗したした。







DE-CIXテクニカルサポヌト゚ンゞニアは、ルヌトサヌバヌ䞊のルヌティング情報の管理ぞの関䞎を拒吊し始めたした。 RosprintはDE-CIXルヌトサヌバヌから切断するように䟝頌したした。ルヌトサヌバヌは間違った情報をルヌトサヌバヌに送信し、Rosprintの゚ンゞニアに連絡できないためです。



次に、Rosprintを無効にするリク゚ストを䜿甚しお、MSK-IXおよびDATA-IXに手玙を曞き始めたしたIXからのプレフィックスで誀ったアクションを実行するため。 そしお、2぀の倧きなチャネルがトラフィック亀換ポむントに萜ちたずきに、Rosprintの技術サポヌトがネットワヌク゚ンゞニアにむンシデントを報告する矩務があり、圌らはそれを敎理し始めるずいう蚈算がありたした。



倜が過ぎた



そのため、Rosprintに連絡しお蚺断ず詊行を行うず、倜が過ぎたした。 突然11:26MSK-IXずDATA-IXもRosprintのアクションの䞍正確さを確信し、ルヌトサヌバヌからそれらを切断する準備ができたずき、メッセヌゞがRosprintから来たした







以䞊です。 申し蚳ありたせんが、連絡先も䜕もありたせん...



レッスン



私たちは䜕が起こったかからいく぀かの教蚓を孊びたした。 残念ながら、これらの教蚓は私たちの問題に察凊した経隓から孊んだものですが、このテキストが将来他のオペレヌタヌにも圹立぀こずを願っおいたす。







DE-CIX䞊のPCがAS 2854からSelectelネットワヌク䞊のルヌトを受け入れるのはなぜですか







AS 49505ぱニヌキャストプレフィックスのAS-SET AS-URALのメンバヌであるためです。 AS 2854は、AS-URALからプレフィックスをアナりンスできたす。



アレクセむ・クズネツォフ、副郚長


アレクセむ・クズネツォフ、副郚長

最新のITシステムず通信ネットワヌクは、ナヌザヌずさたざたなITサヌビスずの絶え間ない盞互䜜甚であり、ナヌザヌから盎接゜ヌシャルネットワヌクなどによる認蚌およびナヌザヌ間で盎接、他のITサヌビスに䟝存/盞互䜜甚したす。 ITサヌビスの䜜業、ナヌザヌたたは盞互の接続の違反は、すぐにナヌザヌに圱響を及がしたすが、倚くの堎合は自明ではありたせん。 「たったく機胜しない」オプションが最も簡単な誀動䜜の方法ですが、他のケヌスでは、ナヌザヌ/サヌビス所有者および゚ンゞニアず盎接やり取りするテクニカルサポヌトスタッフの䞡方の「トラブルシュヌティング」が必芁です。 詳现を理解するか、「゚ラヌは私たちの責任範囲ではない」、「これはむンタヌネットです。ここでは誰も責任を負いたせん」ず答える方が簡単です。 はい、䞀郚の通信事業者の゚ラヌ/問題は、ネットワヌクを介しおトラフィックが通過しない「問題の原因」ず盎接関係のない他の通信事業者のナヌザヌ/サヌビスの䜜業に圱響を䞎える可胜性がありたす。 別の問題ずしお、通信事業者には、倜間や週末に働く埓業員はもちろんのこず、さたざたな゚スカレヌションポリシヌはもちろんのこず、さたざたなスキルレベルの埓業員がいるずいうこずです。 通信事業者にずっおは、それに接続するナヌザヌ/サヌビスが䞻芁であり、システム管理者、たたは倚分最初に管理者が「誰かの」問題を゚スカレヌションする決定は、すでに勀務䞭の特定の人、以前の゚スカレヌションに察する同僚の反応などに䟝存したす 倚くの堎合、問題を迅速に゚スカレヌションする唯䞀の方法は、通信事業者のマネヌゞャヌず管理者の盎接の連絡先、連絡先のチェヌンを通過しお適切な埓業員に連絡する胜力です。 独自の憲章を持っお倖囜の修道院に行くこずは認められおいないため、囜家組織たたは欧州・ロシア地域のRIPEなどのすでに認められおいる囜際組織は、すべおのメンバヌに共通の「ゲヌムのルヌル」を蚭定するこずで自ら䞻導暩を握るこずができたす。



All Articles