🐾 👩🏾‍🏫 ✋🏿 キャッチ、フィッシュ：銀行の「データレイク」の使用方法。 VTBエクスペリエンス 🤫 🙄 👵🏼

あなたは、事業開発、車の購入、またはその他の目的のために銀行に行きます。与えるか与えないか-いずれの場合も、銀行の専門家は、クライアントの信用履歴、収入の大きさ、その他の要因を考慮して、この問題を個別に解決します。クレジットシステムは長い間設定されており、適切に機能しているように思われます。この点で新しい何かを思いつくことは可能ですか？小売VTBでは、この質問に肯定的に答えます。調査によると、銀行が自由に利用できるクライアントの行動に関するデータは完全には活用されておらず、この方向でのITの使用は非常に良い効果をもたらします！

ITをビジネスにどのように統合し、顧客にどのようなメリットをもたらすかについては、以下をご覧ください。

2016年、VTBグループの小売業向けに、顧客情報の処理と分析のための大規模プロジェクトの第1段階を実施しました。このプロジェクトのおかげで、クライアントは過去の行動の分析に基づいてパーソナライズされたオファーを受け取り始めました。最初の段階では、データの最大60％を収集して使用しましたが、結果はすべての予想を上回りました。ほとんどの顧客は個人の申し出を喜んで受け入れ、そして最も重要なことに、満足しました。これは、選択的アプローチのアイデアが機能し、システムが「完全に」機能することを意味します。

次は第2段階です。DataLake（「データレイク」）に基づいた新しいDataResearchPlatformを立ち上げます。これは将来、銀行で利用可能なすべてのクライアントアクティビティデータの99.9％をカバーするはずです。

DataLakeを選ぶ理由

すべての最新のビッグデータソリューションと同様に、新しいDataResearchPlatformは「データレイク」に基づいて構築されています。なぜこの特定のテクノロジーを選択したのですか？ DataLakeは、大量の生データを元の形式で保存できるという点で優れています。このデータは、さまざまな基準に従って比較、混合、整理することができます。標準のデータウェアハウスとは異なり、DataLakeデータは、すべての元の関係で、アナリストがすぐに利用できます。これにより、使用するための最も予期しないオプションを見つける機会が増えますが、そのためには適切なテクノロジーとツールが必要です。

クライアント情報は、データマイニングを使用して処理されます。これにより、銀行の専門家は、クライアントの行動とソルベンシーへの影響に関する仮説をテストし、新しい予測モデルを開発できます。

DataLakeを使用するときに取得する予定の「トリック」は他にもあります。

企業環境でDataArchitectおよびDataScientistプロファイルのユーザーを増やします。
データマイニングで優れた経験を得ます。
顧客情報管理システム（CRM）を完全にレビューおよび改善します。
特定の各クライアントのリスクをより正確に予測する方法を学びます。

システムが整ったら、銀行は最新の釣り竿を持ち、その「湖」で釣りに行くことができます。疑いの余地はありません。毎回、漁獲量は非常に優れており、彼らはそれを顧客と共有したいと思うでしょう。顧客の行動の詳細な分析のおかげで、銀行は借り手に特別なオファー、より良い信用条件、およびローンの個々の（より忠実な）金利を提供できます。

DataResearchPlatformはどのように機能しますか？

DataLakeに切り替える決定が下される前に、VTBにはすでにデータウェアハウスがあったため、最初に行ったのは、新しいプラットフォームをそれに統合することでした。

さらに、最初の段階で、モデリングのための技術環境のデバッグに取り組みました。インストールされているすべてのソフトウェアを更新するメカニズムが完成し、Hadoopクラスターが拡張されました。また、新しいプラットフォームではデータへのアクセスの制限に特定の要件が課されるため、ユーザーの作業に対する新しいアプローチを開発することも重要でした。

その結果、DataResearchPlatformの現在のバージョンは、最大288 TBの容量を持つ12のBDAノードに展開されます（年末までに18ノードに拡張する計画）。このプラットフォームは、Hadoopエコシステム、オープンソーステクノロジー、および産業用エンタープライズソリューションに基づいて動作します。 Oracle BigData Applianceソフトウェアおよびハードウェアソリューションに基づいています。データを操作するには、分析ツールSAS HPDM、SAS EG、Python、Rが使用されます。

DataArchitectおよびDataScientistプロファイルのユーザーは、データへの完全に安全なアクセスを受け取り、データボリュームが拡張されました。現在、DataResearchPlatformでは、銀行で利用可能なクライアントアクティビティに関するほとんどすべての情報が既に収集されています。いつでも「湖」から「キャッチ」され、クライアントの利益のために使用されます。

プロジェクトの作業チーム：VTB24ボードのメンバー-A.ソコロフとS.ルサノフ。

キャッチ、フィッシュ：銀行の「データレイク」の使用方法。 VTBエクスペリエンス

DataLakeを選ぶ理由

DataResearchPlatformはどのように機能しますか？

More articles: