Rを使用したHR分析

これは、 以前の出版物の続きです。







予想外に判明したのは、約1年前に解決しなければならなかったタスクの1つ、つまり大規模なチームの「信頼性」の評価に、「HRアナリティクス」という非常に人気のある名前があることです。 新しいタスクの一環として資料を更新し、彼はロシアのインターネットのオープンスペースで人事分析に関する有益なブログに出かけました。 実際、このブログと著者のEduard Babushkinとの問題の議論は、問題を修正するための出発点として役立ちました。







この出版物は、肯定的なものというよりも、議論分析的な性質のものです。 Rを使用して行うことができるHR分析タスクに最適なアプローチと方法は何ですか。このあいまいさは、研究の対象が自然現象ではなく、特にチームから個々の人に移動するときに常に論理的で予測可能な人間の行動ではないという事実によって引き起こされます。









問題の声明



「HRアナリティクス」という用語の下に隠れているものについては、さまざまな人が異なる意見を持っています。今日の西洋では、一般的に狭いサークルの誇大広告のトピックの1つです。 したがって、ソリューションの明確化とアルゴリズムの可能性のために、最初にこの出版物の枠組みでの解釈を制限します。







従来のHR分析タスクは、2つの非常に異なるクラスに分類されます。









最初のクラスは、人材紹介会社と人事部門の両方にとって興味深いものです。 2番目のクラスは、人事部門(および当然、会社の管理)にとってのみ重要です。







実際、タスクの最初のクラスは、履歴データに基づいて、一定の瞬間に「良い悪い応募者」を評価する(リクルーターと会う)ことになります。 すなわち これは、過去のイベントに関する累積データに基づいて構築された分類子です。 技術的な観点からは、古典的な機械学習法(ランダムフォレストおよびニューラルネットワーク)を含む統計的手法を使用してこの問題を解決できます。 問題は、最適に選択された要因です。







しかし、現在、企業は2番目のクラス、つまり流出管理の問題を解決することに関心を持っています。 そして、ここに滑りの最初のポイントとベンチャーの潜在的な失敗があります。







HRおよび現在のスタッフの維持に関心のある部門の長は、「モデル」、「要因」、「精度」、「トレーニング」、「モデリングの地平線」などの用語をマーケティング担当者から聞き続けています。 大規模なベンダーは、美しい写真や出版物、製品を使用すればすべてがうまくいくことを喜んでいます。 しかし、HRアナリティクスに関する非常に有名な出版物「Watson AnalyticsのHRのユースケース:貴重な従業員の保持」の図を見ると 、たとえば、写真の1つは、シンプルな決定木を使用するよう提案されていますが、美しいキャンディーラッパーであることがわかります。 しかし、タスクは大きく変わりました!







決定木の確認画面







人事スペシャリストの期待は正当化されますか?



再度明確にします。







前述の定式化、つまり、履歴データのトレーニングを必要とする特定の精度(少なくとも75-80%)で従業員の退職を予測するモデルの作成は、最終結果(「ブラックボックス」、以下QWと呼ぶ)のバイナリ分類子の形での期待を明確に示しています「やめる-やめない」 分類子は、単純なロジスティック回帰からランダムフォレストおよびニューラルネットワークまで何でもかまいませんが、問題の本質は変わりません。







問題は、環境および分析対象(従業員)の変化が非常に動的であることです。 構築されたモデルは、すぐに精度を失います。 さらに、時間の経過とともにそれ自体だけでなく、予測期間の延長も伴います。 西部HRアナリストの豊富な経験によれば、IT分野の予測の信頼性は、十分に訓練されたモデルであっても1〜1.5か月ですが、コマーシャルで言うように1〜2年ではありません。







ここで、予測の主な目標は、従業員を維持するために適切な管理の影響を与える能力であることを思い出してください。 しかし、再び、地平線上のさまざまな心理的HR研究によると、1-2ヶ月。 従業員を止めることは非常に難しく、費用がかかります。 彼はすでに辺りを見回し、インタビューに出かけ、精神的に出口に備え、内なる活動を抑制し、物事を詰め込みました。







バイナリ分類子を毎日更新し、新しい履歴データに従ってその精度を調整しても、予測期間を根本的に改善することはできません。 外部環境は非常に急速に変化していますが、新しい要因はまだ発効していません。教えるべきものは何もありません。 さらに、アルゴリズムは最適な経営への影響に関する情報を提供する必要があり、すべての機械学習アルゴリズムがそのような機会を直接提供できるわけではありません。







これは行き止まりですか?



この問題を反対側から見て、医師、社会学者、アクチュアリーのツールに目を向けるだけです。







生存アルゴリズム(生存分析)の適用について話している。 は、主要な西部人事アナ​​リストの観点から最も有望なものの1つです。 Cox比例ハザードモデルと併用すると、解雇の可能性を操作し、解雇の予測曲線を作成し、特定の従業員のさまざまな要因の影響を分析できます。 バイナリ分類から確率的記述への移行により、企業および個々の従業員のライフサイクル全体の進化を見て、トレンドに取り組み、解雇のリスクよりもずっと前の1つまたは別の管理上の影響に応じて解雇の確率の変化を分析できることが重要です。







生存曲線を使用して、異なる従業員を比較し、母集団と個々の従業員の両方で費やした平均時間を計算できます。 はい。また、確率で動作することは、白黒のカテゴリのすべてを評価するよりも成熟したアプローチです。







以下は、処理の可用性に応じて異なる生存曲線がどのように見えるか(オフィスの従業員の実際の滞在を記録するアクセス制御システムから取得したデータ)の例です。 「CEP、結局のところ、絶え間ない改善のストレス、わかりますか?!」すべてがうまくいき、かなり良いです。従業員と会話をして状況を修正する時間があります。







リサイクルは悪い!







参照資料



従業員の退職を予測する必要がある人のために、Rの生存分析に関する有用な資料への一連のリンクを提供します。 これはトピックを理解し、あなた自身のための有用なツールを作るのに十分です:









インターネットでは、本は電子形式で観察されました。







前の出版物- 「非常に熟練した手」:RからTableau / Qlikを作成し、「青い電気テープ」








All Articles