データサイエンスウィーク2016。3日目と4日目のレビュー

こんにちは、こんにちは! Data Science Week 2016の3日目と4日目のレビューを公開しています。つまり、Sberbank Data Dayと人工知能のトピックに特化した日でした。



画像



3日目



データサイエンスウィークの3日目は、主にSberbankがビッグデータテクノロジーを使用して特定の問題を解決した経験について話しましたが、プレゼンテーションの一部は一般的な概念的性質のものでした。



スピーカーは、Sberbankがデータ駆動型組織になりたいという要望を発表しました。これは、着信データの変化に応じてビジネスプロセスが変化し、意思決定が行われる柔軟な構造です。 このため、Sberbankは、市場の顧客が要求する新しいソリューションの立ち上げ速度において競争上の優位性を獲得することを期待しています。



Sberbankは、Hadoop、Spark、およびNoSQLソリューションに基づいて、ビッグデータを保存および処理するための効果的なインフラストラクチャを作成しました。



Sberbankでのデータの収集と使用の主な焦点はクライアントにあり、「クライアントの周りのデータを結合します」。 ビジネス上の問題を解決するために、同社はさまざまな内部および外部データを分析しています。



顧客プロファイルとアプリケーションの内部データ、取引の履歴、銀行サービスの使用に基づいて、高度な顧客プロファイルが構築されます。 クライアントは、関心のあるオファー、どのチャネルを介して作業するのがよいかを理解するために、社会人口統計学的パラメーター、ニーズ、好みによってセグメント化されます。



クレジットスコアリングでは、社会人口統計学的パラメーター、クレジット履歴、取引履歴、財務諸表などの従来のデータだけでなく、他の多くのデータも使用します。 たとえば、企業はクレジットスコアリングと不正行為の検出の両方で、モバイルオペレーターからのデータを使用します。 詐欺の影響を受けやすいのは、多数のアクティブなSIMカードと短時間の作業、小規模で多数のリチャージアカウント、通話の地理的状況です。 タスクのスコアリングにも、送金のデータとソーシャルネットワークのデータに基づいて作成された顧客接続のグラフが使用されます。 企業のクレジットスコアリングには、言及のあるニューステキストが使用されます。そのために、調性の自動分析が実行されます。



現在、会社の引受プロセス(基本的なカテゴリに関する決定を行うという点で)は、ほとんど自動化されています。 得点カードの再構築も自動化されていますが、自動的に再設計された得点カードを受け入れるかどうかは専門家が決定します。



Segmentoの Alexander Kulikov氏は、一連の取引と支払いパターンを分析することで、顧客の生活における重要なイベント(たとえば、治療に多額の費用をかける、車を買うなど)を特定し、クライアントが近い将来に行う取引を予測する方法について説明しましたどのカテゴリ。 これにより、顧客は最も関連性の高いオファーを作成できます。 顧客データとその行動の分析により、事前承認されたローンのオファーを生成し、顧客が最も需要があるときに正確にそれらを顧客に提供できます。



検索クエリデータは、Sberbank Webサイトの表示をパーソナライズするために使用されます。 たとえば、クライアントが観光に興味を持っている場合、彼は海外旅行者に保険が提供されます。



同社は、ディープラーニング手法による画像分析も適用しています。 しばらく前に、SAFIはSberbankに導入されました。これは、写真を分析して、文書の詐欺や顧客の識別を防ぐためのシステムです。 その結果、このタイプの詐欺による損失は10倍減少しました。



別のプレゼンテーションでは、モデルを使用するリスクについて説明しました。 ここで、スピーカーは、データ、モデル、プロセスという3つの主要なリスク領域を特定しました。 データのリスクは、それらの不整合、不完全性、非代表性、および排出の存在に関連しています。 データ内のこれらの問題に気づかずに修正しないと、エラーのコストが非常に高くなります。 モデルとその適用に関しては、受け入れられた施設の違法性のためにエラーが発生する可能性があります.1つのサブジェクトエリア用に開発されたモデルを別のサブジェクトに盲目的に転送しようとする試み、および人的要因(詐欺、組織内の利益相反)が原因です。 モデルのリスクを制限するために、同社はユーザーのフィードバック、モデリングとデータ準備の明確な標準、適用可能性についてモデルをテストする手順を使用しています。



この日の最後のスピーチはeToroソーシャルトレーディングプラットフォームに捧げられ Sberbankは積極的な協力を開始しました。 このシステムはソーシャルネットワークの原理に基づいて構築されており、システムの成功したトレーダーから受信したデータ(分析、取引履歴)をアクセス可能な形式で集約して表示します。 成功したトレーダーから、信託基金の類似物が自動的に形成されます。 ユーザーのプロファイル、経験とリスクに対する態度、利用可能なレバレッジが変化し、適切な資産とトレーダーの自動提供が行われ、その動作をコピーできます。 このプラットフォームの目的は、資産を管理したいSberbankの顧客を含むすべての人に、金融市場へのシンプルで理解しやすいアクセスを提供することです。



4日目



データサイエンスウィークの最終日は、人工知能に捧げられました。 広い意味では、人工知能についてはほとんど、主にチャットボットとパーソナルアシスタントを使用する見込みについてはほとんど言われていません。



画像



Inten.toのKonstantin Savenkovのスピーチは、このトピックに直接当てられました。 スピーカーによると、多くの傾向は、この分野の将来の急速な発展を示しています。



まず、人々はソーシャルネットワークよりもメッセンジャーに多くの時間を費やしており、ビジネスはこのチャネルを含めて顧客に行きたいと考えています。 ここでの解決策の1つは、ボットを使用することです。



第二に、メッセンジャーを開発しているほとんどすべての大企業は、ボットとパーソナルアシスタントの作業用のプラットフォームを作成していますが、まだ誰も使用していません。 この方向で巨額の投資が行われています。 一度作成されたボットを異なるプラットフォームで実行できるコネクタサービスが表示されます。



最後に、API市場は成長しているため、パーソナルアシスタントは管理する必要があります。



ボットとアシスタントの使用の見通しについて話し、スピーカーは、便利なグラフィカルインターフェイスをボットに置き換えようとしても何も起こらず、プロセスを複雑にするだけであると述べました(たとえば、チケットを注文するとき)。 ただし、人とコミュニケーションをとるときのように、対話が限られた情報の入力に基づいている場合、チャットボットは効果的です(例:コンシェルジュ、割り当ての履行、法務サービス)。 インテリジェントなアプリケーションは、ユーザーが間違いを避け、選択のアドバイスを提供し、決定を下すのに役立ちます(ウェイター)



スピーカーによると、今日この分野で最も有望なパラダイムは、スピーチとメッセージのコンテキストを理解するための高度な技術を使用するが、シンプルなサービスを提供するパーソナルアシスタントです。 音声と文脈を理解した後、意思決定段階が続きます。 たとえば、食材に応じた料理のワインを選択できます。 次に、サービスプラットフォームが機能します。これは、ユーザーの注文を満たすために使用されます。



現在、特定の注文を実行する方法は、通常、会社によって手動で規定されているか、クラウドソーシングによって選択されています。 Inten.toは、タスクを解決するために必要なAPIをパーソナルアシスタントが自動的に選択するためのツールを作成するという市場での地位を確立しています。



Segmentoを代表するEugene Legkyは 、技術の開発における人工知能の役割と、将来の労働生産性の低下を回避するのに役立つ主な傾向について話しました。 スピーカーによると、将来、人間の労働範囲は大きく変わるでしょう。 経済部門は、要求に応じて拡大します(例:Uber、GetTaxi)。必要なときにサービスを注文して受け取ります。 フリーランスが拡大し、主な仕事とともに他のプロジェクトに携わる人がますます増えています。 特定のプロジェクト用に柔軟なチームが作成され、従業員の注文が一般的になります。 ますます多くの人が小さなタスク(マイクロタスク)を実行し始め、これらの小さな操作でマイクロ生産性が向上します。 最後に、人工知能に基づいた技術が私たちの生活に入ります。



画像



NVIDIAの代表者Anton Dzhoraevによるスピーチは、人工知能そのものではなく、この分野で広く使用されているディープラーニングを実装するためのハードウェアおよびコンピューティングプラットフォームに捧げられました。



今日、たとえばBaidu Deep Speech 2などのニューラルネットワークは、すでに人間の音声認識品質において同等です。 ただし、これは計算を繰り返し複雑にし、使用するデータの量を増やすという犠牲を払って達成されました。 同時に、アプリケーションでそのようなテクノロジーを使用するには、迅速な対応が必要です-ユーザーはあまり長く待つことはありません。 そのため、NVIDIAは、既に訓練されたニューラルネットワークを実行し、高いパフォーマンスを提供するための戦略を生成するソフトウェアとハ​​ードウェアの作成に注力しています。 同社は、ディープラーニングで使用されるTensorFlowフレームワークの独自のアナログを開発しました。これは、特定のハードウェアで使用するために設計されているため、より高速に動作し、論理的な最適化が可能です。



最後の会社であるRiftmanは、XorシステムでITスタッフを雇用する際にボットを使用する予定です。 システムは、GitHub、StackOverflow、およびその他のリソースに開発者が投稿したコードの例を分析し、必要なスキルを持つ専門家を見つけます。 システムは、再開の検証に同様のメカニズムを使用します。 さらに、候補者とのコミュニケーションは、彼が現在仕事を探しているかどうかに関係なく、ボットを使用して実行されます。



ニコライ・マノロフによると、非常に多くの専門家がすでに現在の地位を超えており、興味深いオファーを待っているが、実際には人事の専門家からは見えなくなっている。 ボットを介して人に連絡する方が簡単です。手紙はスパムに送信され、電話は否定的な反応を引き起こす可能性があります。 候補者が提案を好まない場合、ボットは選択モデルをさらに改善し、どの条件を誰に提供する必要があるかを理解するために、彼からフィードバックを収集します。 また、ボットはインタビューをスケジュールし、テスト項目を送信できます。 したがって、この分野のほとんどすべてのプロセスを自動化できます。



»すべてのプレゼンテーションはこちらから入手できます。



»ビデオスピーチへのアクセスは、 ここから入手できます。



All Articles