hh.ruの履歴書における教育の正規化





教育は最も重要であると同時に過小評価された履歴書分野の1つです。 主に若い専門家が仕事を探しているとき、雇用主はそれに注意を払います。 多くの場合、候補者の1人に有利に決定するのは教育です。 最後に、企業は希望する大学の教員に至るまで、非常に具体的な教育を受けた専門家を探していることがあります。



応募者は、履歴書での教育はあまり進んでいないことを示しています。 教育分野での略語は別の良い選択肢です。 多くの場合、単に「技術的」または「レーニンの名の下に」出会うことができます。



最近まで、hh.ruの「教育」はフリーテキストフィールドでしたが、この基準では候補者を完全に検索することはできませんでした。履歴書の中で教育に関する情報を視覚的に簡単に読むことができました。 したがって、大学のディレクトリを作成し、このフィールドを正規化することにより、ユーザーを支援するときが来ました。



この記事では、1100万人の履歴書でこの問題をどのように解決し、ユーザーがどのように反応したかについて説明します。





大きな目標は、最初に履歴書を作成するときに新しいユーザーがディレクトリから大学を選択し、次に既存のユーザーが履歴書を同じ方法で更新することでした。

教育機関の拠点は、オドノクラスニキの同僚から親切に提供されました。 ディレクトリの作成作業の過程で、ディレクトリを大幅に作り直しましたが、基盤はすでに構築されていたため、最初の作業は大幅に加速しました。



ステップ1.記入時の提案



まず、履歴書を作成するという形で、ドロップダウンのヒント(sajesta)をディレクトリにある大学の正しい名前と完全な名前で追加しました。 そのようなスキームの作業の1か月半の間に、私たちが提案した大学を選択するのは新しいユーザーの45%だけであり、残りは提案されたものと完全に一致したとしても、バージョンを残すことを好みました! その結果、正規化された教育で20万件の履歴書を受け取りましたが、この指標を少なくとも1桁増やす必要がありました。







ステップ2.マッピング



新しい履歴書は良いですが、プロジェクトが意味をなし、今日利益を得るためには、既存のベースを正規化する必要がありました。当時は約1,000万件の履歴書でした。 そのため、私たちは、ユーザーによってすでに自由形式で大学の新しいディレクトリに示されている「教育」をマッピング(比較)することにしました。 ユーザーは履歴書に教育を示し、控えめに言って非常に大まかに覚えておく必要があります(「高い」という言葉も非常に一般的なオプションです)。



マッピングには、2つのテキストの類似性を見つけるための古典的なアルゴリズム、 コサイン類似性が使用されました。 各テキストは、用語(単語、そのコンポーネント)の空間内のベクトルと見なされます。 テキスト内で単語が出現する回数が多いほど、対応する軸上のベクトルの座標が大きくなります。 2つのテキストの類似性は、用語空間におけるベクトル間のcosに他なりません。

このアルゴリズムを「真正面から」使用しても、それほど印象的な結果は得られなかったため、修正を加える必要がありました。



1.テキストに対応するベクトルの座標は{0、1}の値を取ることができます-実際、教育機関の名前に含まれるいくつかの同一の単語は異国的です。

2.用語の空間を異方性にする必要がありました。いくつかの軸に沿った座標は、この空間のノルムに異なる寄与をします。

頻繁に使用される単語(たとえば、「州」、「技術」)がありますが、これらは省略したり、教育機関のカスタムスペルで表示される場合があります。 また、テキストの類似度への影響が少ないはずです。 それどころか、「(クイビシェフにちなんで名付けられた)クイビシェフ」などの言葉はより重要であり、通信を確立する可能性が高くなります。 したがって、類似性のレベルを決定するとき、テキストを構成する単語は、一致の検索の重要度が異なるいくつかのグループに分割されます。



大学。 レガシー

大学の名前を変更することも、解決しなければならない別の問題です。 たとえば、かつて教育学研究所と呼ばれていたものは、現在教育学大学と呼ばれています。 したがって、マッピングの際に、可能な同音異義語が考慮されます。 ちなみに、90年代には多くの都市の名前が変わったため、同名の「Kalinin Pedagogical Institute」の枠組みの中で、「Tver Pedagogical University」にマッピングする価値があります。 さらに、今日の雇用主は、基本的に、機関の現代名のみを知っています。



略語の一致

別のタスクは、一致する略語で構成されていました。 まず、いくつかの教育機関は異なる時期に同じ略語を使用しました。たとえば、サマラ州立大学(旧KSU(Kuibyshevsky))とクルスク州立大学-本物のKSUです。



第二に、異なる国の教育機関も同じ略語を持っていることがよくあります。たとえば、BSUはブリャンスク州立大学にちなんで名付けられました。 I.G. ペトロフスキー、ベラルーシ州立大学。 このような対立を解決するには、教育機関が所在する都市、人口、履歴書所有者の居住国に関する情報を考慮する必要がありました。 使用された多数のヒューリスティックによって、マッピングの大きな助けも提供されました。



マッピング結果

その結果、私たちは履歴書のすべての高等教育の半分以上を「マッピング」することができました。12510 682のうち6 989453。テストとチェックの後、結果をユーザーに公開し、ユーザーの反応を調査する時であると判断しました。



ステップ3.履歴書で大学を確認する



ユーザーは静かに機関の名前を変更することはできません。 単独でシステムに編集が加えられ、これまでディレクトリに不正確があった場合、それを好む人はほとんどいません。 そのため、求人の掲載ページに「履歴書にある教育機関の名前を指定してください」という通知を作成しました。 結果-このリンクをクリックしたのを見たユーザーの10%未満:この方法で目標を達成できませんでした。 おそらく、ユーザーは「教育」では大丈夫で、チェックするものがないと確信していたでしょう。







ただし、この通知のおかげで、まず典型的なエラーが見られ、次に奇妙なパターンが見られました。すべてを正しくマッピングしたとしても、ユーザーは引き続きバージョンを返しました。 将来的に検討する価値がありました。



一般に、通知の2週間の間に、適切な教育を受けた別の15万人の履歴書を受け取りました。 合計で、大学のディレクトリが存在してから2.5か月間、45万件のザッパ履歴書がありました。これは、ベース全体の約5%です。 この結果は再び印象的なものではなく、結論を出し、次のステップについて考え続けました。



ステップ4.受動ユーザーをピックアップする方法



sagestasと通知の助けを借りて、サイトにアクセスするアクティブユーザーのみを対象にしています。 現在仕事を探していない志願者に連絡するために、登録志願者のデータベースの一部に郵送することにしました。 手紙には、履歴書から教育に変更を加えたため、確認する必要があると書いていますが、拒否することもできます。





書簡の論理は次のとおりです。









拒否のすべてのケースをバージョンからアンロードし、それらに基づいてディレクトリを再度チェックし、必要な変更を加えました。



ここで、履歴書の変更に関する文言はあまり成功していないことに注意する必要があるため、データベースの別の部分では、大学の新しいディレクトリについて話し、ユーザーが自分で大学の名前を更新することを提案する手紙を送りました。







ニュースレターの1週間後、データベース内のディレクトリからの教育を受けて履歴書を1,000 052件完了しました。これは必須ではありませんが、すべてではありません。 そのため、大学を更新する提案をメールで送り続け、これがなぜ必要で、何が申請者に与えられるかを説明しました。 大学の正規化を支援するために、 「大学の戦い」プロジェクトを開始し、ユーザーに履歴書の更新を促し、それによって大学が即興の戦いを支援するようにしました。 もちろん、このプロジェクトは、大学の客観的な格付けのふりをするものではありませんが、それでも教育の正常化に一定の貢献をした(そして引き続き行います)。







ほんの数日前に、英語の大学名のオプションを追加しました(英語の履歴書用)。 すべてではありませんが、その数を増やします。



その結果、データベースには、正規化された教育を受けた履歴書の23%(約330万件)があり、年内には30%に達する予定です。



履歴書で教育をまだ更新していない場合は、今がそれ行うときです。



あなたの大学がまだディレクトリにない場合は、それについて私たちに書いてください 。それを追加します。



ステップ5.大学の検索が最初に開始されました



実際、すべての履歴書の4分の1が通常の教育を受けており、この割合が絶えず増加しているという事実により、大学の検索の第1段階をリリースしました。 現在、採用担当者は履歴書でクリックするだけで特定の教育機関の卒業生を見つけることができます。検索フィルターの助けを借りて、選択をすばやく目的の都市、職業、候補者の経験、言語スキル、希望する雇用形態などに絞り込みます。 希望することを正確に把握している雇用主、または(好きなように)好き嫌いがある雇用主にとって、適切な候補者を見つけるのが簡単になりました。 しかし、これはほんの始まりに過ぎません。







教育の正規化は正規化プロジェクトの一部にすぎません。これには、職位、スキル、雇用主、専門分野の正規化も含まれます。



このプロジェクトについてアイデアや質問がある場合は、コメントでいつでも歓迎します。



All Articles