ビデオ、レポート、およびライブブロードキャストを視聴する時間がない人のための簡単なレポート。
Superjobオフィスでは、データサイエンスのMeetupを開催しました。 ルノー、ティンコフ銀行、エルドラド、SAP、Vimpelcom、Delloite、VTBなどの専門家を含む約100人のアナリストと開発者がレポートを聴きに来ました。 約500人が生放送を見ました。
最初は、Superjobのシニア開発者であるDmitry Kozhokarでした 。 彼は、類似の空席をグループにまとめる問題を解決した経験と、それに基づいた空席の検索結果の形成について話しました。 顧客とビジネスの要件を考慮して、非常に類似した空席の検索結果を効果的にクリアする必要がありました。
彼のレポートで、Dmitryは自然言語処理の問題を解決するためのアルゴリズムを実装する実践を開示しました。 また、SimHashアルゴリズムと階層的クラスタリングのアプリケーションに関する技術的な詳細も提供しました。 レポートの最後に、Dmitryは、開発されたアルゴリズムの成功を評価するパフォーマンス指標をリストしました。
ドミトリーのプレゼンテーションはこちらです。
Sberbank-Technologyモデルの研究開発能力センターのモデル開発責任者であるMaxim Savchenkoは、このようなモデルの開発と実装における人事管理(HRM)問題、技術的問題、法的制限における機械学習法の適用の特徴について話しました。 レポートは、人材の大量選択における候補者の信頼性を評価するための統計モデル(不正防止モデル)と、ユニットの有効性をユニットの従業員の専門的資質と行動、およびこのユニットの仕事の組織化の仕様とリンクできるモデル(離職の影響)の開発に関してSberbankで実施されたパイロットの結果も提示しました従業員の人事、労働、役員の規律、資格、教育など)。 入力データとして、人事システム、タイムシート、候補者の信用履歴に関する情報、および候補者の入力調査の結果からの情報が使用されました。
マキシムのプレゼンテーションはこちらです。
マイクロソフトの戦略技術の専門家であるユージングリゴレンコは、医療データの分析に関連して機械学習を使用した経験を発表しました。 彼は、モデルをテストして結果を視覚化する必要性に特に注意を喚起し、結果の証明不能性によるニューラルネットワークの限定的な適用性についても言及しました。 ユージーンは、患者の血液の酸塩基状態(KHS)と集中治療室での患者の状態に関する情報との関係を明らかにする方法を構築した経験について話しました。 入り口で、彼は各分析の血液組成の16のパラメーター(1日に2回蘇生患者に与えられた)と集中治療室からの退院時の患者の状態に関するデータを持っていました。 ユージーンは、解決策を見つける際に経験した非常に多くの方法に言及し、成功した仮説がどのように発見されたかを説明しました。 この仮説は6か月間テストされ、現在では臨床試験で使用されています。
ユージーンのプレゼンテーションはこちら 。