![](https://habrastorage.org/webt/4r/2k/de/4r2kdef9h3fieollcezqj2vwszk.jpeg)
数か月前から、実験を行いました。Habrでロシアのパスポートを発行するユニットの適切なディレクトリを収集することは可能でしょうか? これは便利です。多くの人がこのデータを必要とし、標準的なソースはなく、既存のものはまあまあです。
そして、あなたは知っている、すべてがうまくいった。 使用可能なガイドの準備ができたら、ダウンロードして使用できます。 フォームへのユニットの入力を高速化するヒントも作成しました。
「裸の」CSV-パブリックドメイン
GitHubに投稿したコンパイル済みのクリーンなリファレンス。 内部はすべてシンプルで、2つのフィールドを持つCSVです。
- 部門コード;
- ユニット名。
ここにありますgithub.com/hflabs/fms-unit/releases/latest
入力フォームに関する既製のヒントもあります(無料)
ユニットを集めて既製のサービスを作成しました-入力フォームのヒント。 これで準備完了です。
「ヒント」DaData.ruは、サイト、CRMまたはCMSに統合でき、思いやりのある仲間と見なすことができます。ユーザーはユニットコードを入力するだけで、名前がサービスを満たします。
![](https://habrastorage.org/webt/hi/ow/pn/hiowpn7nn-fcbwhqacerbme5os4.gif)
誰もがユニット名の入力を嫌うようです。 私たちは人々の苦しみを軽減しようとしました
「ヒント」でさえ、コードからリージョンとユニットのタイプを引き出します。時には便利です。 これが答えの簡単な仕様です。
役職 | 説明 |
---|---|
価値 | 単一行の値(プロンプトリストに表示) |
data.code | ユニットコード |
data.name | インストゥルメンタルケース内のユニットの名前(「誰が発行したか?」) |
data.region_code | 地域コード |
data.type | ユニットのタイプ:
|
詳細はdadata.ru/suggestions/outward/fms_unit/にあります。
データに最適な「Habr」
プロジェクトについて聞いた人の最初の質問:「本当に、Habrを通して、あなたはそれを集めましたか?」 「Habr」が役立っただけでなく、行商人の貢献は大きくて広範囲です。 私たちは感謝し、少し驚いています。初めてコミュニティに目を向けたとき、すぐにそのような結果になりました。
最初は、いくつかの開発がありました。 しかし、まず、完全な参照からはほど遠い。 第二に、実際のパスポートにデータがどれだけ適しているかを確認したかった。
私たちが叫びを投げたとき、多くは彼らのパスポートからコレクションフォームを通してユニットを送りました 。 彼らはそれぞれ1つから5つから10のレコードを送信しました。 このすべてを自分の手で運転するのが面倒ではないヒーロー-尊敬。
かなりのサイズの個人データベースで提供された3人。 フレンドリーで無料。
![](https://habrastorage.org/webt/6w/7y/9m/6w7y9m3_ggxfqzxuiqnin55b-fw.png)
セキュリティを心配する人:すべてのディレクトリは、個人データのバイトではなく、匿名で送信されました
そのような贈り物は物事を大きく前進させました。 その結果、3週間後、産業用途に適した製品を作るのが恥ずかしくない量を集めました。
成功への道-「生データの束+ 300 regekspov +少しのピトノッキ」
したがって、生データはダダタナルゲオン食品の手にあります。 彼は見出しからの引用でさらにダンスを説明しました。 私たちが収集したすべては、一連の素晴らしい変革を経てきました。
まず、ユニット名を正規化しました。 ここでは、ファイルを熱心に処理する必要がありました。 たとえば、「ライブ」パスポートでは、領土単位の番号は「No.」で示されます。「TP No. 1 in G. Khimki ...」。 1つを除いて、収集されたディレクトリの大部分にも同じことがあります。「No」のないすべての番号が含まれています。「TP 1 in G. Khimki ...」。 埋め込む必要がありました。
年が崩壊しました。 いくつかのディレクトリでは、ユニットの名前は、時間が経っても変わらない場合でも、年ごとに「ぼやけ」ています。
500-168, . . ,2007
500-168, . . ,2008
500-168, . . ,2009
500-168, . . ,2010
このようなレコードを組み合わせて期間に関連付けました。上記の例では、4つのレコードのうち、日付が「2007-2010」のレコードを取得しました。
別のガイド「2018+」を収集しました。 2018年にクーデターが発生しました。現在、この地域の内務省の「最高」部門の名前はパスポートに記載されていません。 したがって、クラスノヤルスク準州で発行された文書では、コードに関係なく、「クラスノヤルスク準州全体のロシア内務省のGU」を示しています。
収集したすべてのコードを取得し、地域ごとに分けて、2018年のスタイルで同じ名前を生成しました。 名前は収集されたディレクトリから取得されたもので、インターネット上で何かを検索する必要がありました。 そのようなことが判明しました。
240-001, ,2018
240-002, ,2018
240-003, ,2018
年が削除されました。 ディレクトリには完璧な騒動がありました。どこかで、何年も、どこでもないということが判明しました。 より完全な参照のために年を削除するか、何のために長年にわたってユニットのみを残すかは、どこにでも残っています。 より完全なリファレンスを選択してください。
ディレクトリが結合され 、エクスタシーのデータが結合されました。 彼らは結果をぼろ布で徹底的にこすり、それをとかし、それを思い出させました。例えば、「RA」を「アルタイ共和国」に変え、さらに多くのそのような変更を加えました。
これで、ガイドの準備ができました。 それを使用して、あなたはあなた自身のためにそれをしました(実際には、あなた自身のためにそれをしました:)。
腐食性の微妙な点
ディレクトリには、同じユニットコードのエントリが多数あります。 これは、パスポートの異なる年に同じユニットのスペルが異なっていたという事実によるものです。 同様のオプションを組み合わせましたが、非常に異なるオプションを残しました。ユーザーがドキュメントでどのように使用するかを選択できるようにしました。
パスポートとディレクトリの記述が少し異なることが判明する場合があります。 最小限の正規化がなければ、各ユニットには、適切なオプションを見つけることができる同様のオプションが多数あります。 そのため、「内務省」を「ATC」、「都市」、「GOR」-「G.」、「パスポートとビザサービスの部門」-「OVPS」などに減らしました。
![](https://habrastorage.org/webt/1x/95/v2/1x95v22jqkfznpcnz95ga3acqyc.png)
名前の入力を開始すると、「ヒント」も貢献します
しかし! 単一の法律や条例では、文書内のユニット名がパスポートのオプションと文字通り一致することを要求していません。 略語と省略は許可されます。 主なものは、他の詳細がほぼ同じで同じであるということです:シリーズ、番号、日付、単位コード。
エラーはdadata.ru/fix/fmsに報告できます。 問題レコードのコードと名前を示し、何が間違っているかをコメントに記入してください。 全員のために更新されたガイドを修正してレイアウトします。 または、プールリクエストをGitHubに送信します。
当然、「ヒント」のない裸のマニュアルがある場合は、手でCSVを修正できます。 しかし、私たちからディレクトリの次のバージョンを取得した場合、すべてが停止する方法は明らかではありません。
一般的に、あなたの健康を使用してください:
記事を共有する場合、パスポートからユニットのディレクトリを探している人を助けてください。 苦しんでいる人に感謝します。