ロシアのすべての入植地と地域の拠点

あるプロジェクトでは、ロシアの地理的な名前のベースを作成する必要がありました。 そのような情報のすべてのソースの中で、最も権威のある人は私に思われた2:



後者の方が簡単で、より完全で、冗長性が少ないように思えましたが、そこにある集落の名前は4倍です。 OKATOを選んだのは、Wikipediaでベースの少なくともいくつかの説明を見つけ、郵便番号に完全に理解できない情報があったからです。 このデータベースでは、必要な地理的単位から不要な管理単位を除外する必要がありました。



スクリーニングはいくつかの段階で行われました。 まず、地域、領土、共和国を選択しました。 トップレベルの階層。 それから彼は都市と町を取り上げた。 すべてのスクリーニングは経験的に実施されました。 パターンを明らかにし、市町村や大都市のエリアなど、不要な殻をすべて取り除きました。 パターンを説明すると、ポイントが表示されません。 各分類レベルには、管理ユニットをドロップアウトするための独自のルールがあります。これは、以下のファイルのソースコードで確認できます。 リージョンの結果ファイルでは、最初のフィールドに識別子を作成し、最後のフィールドに決済へのリンクを作成して、データベースにリージョンへの決済の帰属をインポートすることに注意します。 形式はcsvに変換されました。それ以外の場合、データ形式は同じままです。 データベースに最も可能性の高いエラーがあると想定する必要があります。 誰かが見つけたら、コメントを書いて、編集します。和解の総数は約14万に達し、それらすべてを追跡することは非常に問題が多いからです。

したがって、Pythonのコードファイルは、スクリーニングと分析が行われた助けを借りて、地域と私たちと分析した後の2つの最終ファイルです。 ポイントはここからダウンロードできます 。 私の仕事が他の人に役立つことを願っています。



All Articles