MentorHackの結果ダむアログからタスクを抜出するチャットボット、キャリアパスずコマンドを構築するサヌビス

最近、 MentorHackずいう組織に参加したした。これは、䌁業環境、起業家粟神、教育におけるメンタリングのためのサヌビスを䜜成するハッカ゜ンです。



ハッカ゜ンに぀いお少し説明したす平日を通しお、FSOは、通信からタスクを自動的に遞択するチャットボット、勝者ぞのフォヌラム、将来の垌望のポゞションぞのキャリアパスを構築し、プロゞェクトのためにチヌムを線成するサヌビスをチェックしたす。







たず、ハッカ゜ンのベヌストラックには2぀の埓来のテヌマ領域があったこずを思い出しおください。500,000ルヌブルの賞金プヌルを備えたAIボスのあらゆる皮類のマッチングず芁玠です。



同様に2぀の同様に倧芏暡な特別ノミネヌト





200人ずいうかなりの数の参加者がいたので、ハッカ゜ンプロセスの参加者を陀倖するこずが決定されたした。 このため、1日目ず2日目に、プロゞェクトの完党性を評䟡するために、参加者ず圌らのアむデアず珟圚実装されおいる機胜に぀いお話し合いたした。 圌らは、さたざたな䌁業のキュレヌタヌず譊備員を突砎する資金の䌚瀟で非垞に元気に歩いおいたしたが、ほずんどのチヌムはそのような圢匏の準備ができおいたせんでした-プレれンテヌションプレれンテヌションの叀き良き圢匏が期埅されおいたした。 30チヌムが決勝戊に出堎し、20名のドロップアりトに぀いお倚くの喜びの感情を感じ、コヌドの代わりにデザむナヌから方法論の抂念ず衚を蚘入できないずいう事実に぀いお話したした。

最終的に、審査員は4぀の基準に埓っおチヌムを評䟡したした。



-技術的な実装、

-孊習レベル、

-関連性ず関連性、

-商業的可胜性ずスケヌラビリティ。







予想どおり、実際、ほずんどの堎合、,審員は実際に各チヌムに1぀のマヌクを付けお、䞀般的な印象-奜き/嫌いを衚すため、4぀の基準のスコアは非垞に近かった。



最終評䟡のために、審査員の意芋は、コヌドの品質ずパフォヌマンスに関するキュレヌタヌの評䟡を平均したした。







グラフは、優れたプロゞェクトがプレれンテヌションず技術的な実装の䞡方でほが垞に高い評䟡を埗おいるこずを瀺しおいたす。 別の嚯楜は、むンタヌネットがなく、倚目的なパビリオンの音を凊理するプリンタがない状態で、20人の裁刀官の芋積もりをリアルタむムで凊理するこずでした。 しかし、私たちはexel甚にいく぀かのマシンドラむバヌを入れお管理し、最終的にこれらの評䟡を埗たした。







圌らのプロゞェクトの勝者



ゞェットレックス



Notaプロゞェクトは、自然蚀語でチャットを操䜜するためのボットアシスタントであり、察応する配信されたタスクを匷調しおいたす。 始めるには、チャットにNotaを远加しおTrelloに登録する必芁がありたす。 その埌、ボットは䜕をすべきかを教えおくれたす-それは簡単です。







チャットに远加するず、ボットは、あるナヌザヌが別のナヌザヌにタスクを蚭定するメッセヌゞを怜出したす。 このメッセヌゞでは、Notaは期限ず請負業者を決定し、受信したデヌタに基づいおtrelloでタスクを䜜成したす。 同時に、Nota自䜓は、タスクの本質に基づいお、ニュヌラルサマラむザを䜿甚しおタスクの名前を生成したす。 Notaは、通垞のメッセヌゞずフラッドを実際のタスクず区別したす。



たずえば、「@ viktorboyko09、来週の四半期報告曞を準備しおください。昚日Skypeで話した報告曞」ずいうテキストから。 NotaはTrelloで、「レポヌト準備」ずいう名前でタスクを実行したす。これは「2018幎2月26日たで有効ですNotaはタスクの蚭定日から7日間カりントされたす」、責任のある「Victor Boyko」、および元のテキストに察応する説明です。







分類子をトレヌニングするために、フォヌラムdrom.ru、moskvaforum.ru、women.ru、antiwomen.ru、yourdomain.ruからのメッセヌゞに基づいおデヌタセットが䜜成されたした。これはタスクではないメッセヌゞを刀別するためです。 たた、タスクの䟋ずしお、youdo.ruおよびfl.ruからのメッセヌゞが収集されたした。 その結果、3500䞇件以䞊のサンプルが収集され、そのうち300䞇件がタスクでした。 サマラむザOpenNMT実装のseq2seqのトレヌニングに䜿甚したのは、タスクずその芋出しに関するデヌタでした。 競技䞭に、タスクはしばしば呜什的なムヌドで正確に提瀺され、デヌタセット内のタスクは䞍定詞の動詞を䜿甚しおいるこずがわかりたしたたずえば、「[need] paint the fence」。 そのため、私たちはデヌタセットを、呜什的なムヌドの動詞を持぀メッセヌゞで増匷するこずにしたした。 これは、pymorphy2関数inflectを䜿甚しお簡単に実行できるこずが刀明したした。 ここでデヌタセットを怜玢したす。

サマラむザヌトレヌニング- トレヌニングずテスト 。

分類子トレヌニング- トレヌニングずテスト 。



線圢カヌネルを備えた䞀時的なtfidf + SVM分類噚は、その埌CNN分類噚に眮き換える必芁がありたす。 しかし、これは起こらず、䞀時的なオプションが最終決定のたたでした。なぜなら、神経分類噚は競技終了埌わずか1日で孊習したからです。



チヌムメンバヌはさたざたな蚀語で蚘述したため、アヌキテクチャぞのサヌビスアプロヌチを遞択したした。 サヌビスアヌキテクチャにより、Python合蚈、NER、およびフレヌズの分類のサヌビス、GoTelegramの入出力、Node.jsTrelloの入出力で蚘述されたモゞュヌルを簡単に組み合わせるこずができたした。 サヌビス間のIPCは、暙準の入出力ストリヌムに基づいお構築されたした。



グルヌプにmanager_assist_botを远加しお、ボットを詊すこずができたす。 Notaのデモバヌゞョンずしお、Trelloはすべおのタスクを1぀の共通ボヌドに远加したす。



トグラ



私たちは、スキルに適した空垭を候補ごずに遞択し、各方向のさらなるキャリアパスを瀺し、たた、垌望するポゞションに到達するために匕き䞊げる必芁があるスキルを説明できるシステムを開発したした。 jsonの履歎曞ず空垭、解決策を考え出す時間がありたせんでした。経隓を実際の仕事ず比范するこずは論理的であるず考えたした。これは、仕事を必芁ずするスキルを埗る人の幎衚のアむデアを䞎えるからです 雇甚䞻。



䞻な問題は、デヌタの量でしたそれぞれ250,000の空垭ず履歎曞。履歎曞ごずに、職務経隓は少なくずも3〜4ポゞション、時には50たで。 比范のためにword2vecを䜿甚する堎合、1日以䞊かかりたすが、これはハッカ゜ンでの最適なステップではありたせん。 したがっお、TF-iDFを䜿甚した履歎曞で、職務経隓に぀いおほが同様の空垭が芋぀かり、最終的な回答適切かどうかにかかわらずからword2vecが埗られたした。 空宀を照合したら、空宀の候補から芁件フィヌルドからスキルを匕き出したす。 正芏衚珟、ロゞック、ブラックマゞックの助けを借りおこれを行いたした。 すべおの芁件は掟生スタむルで蚘述されおいたため、ロゞックず正芏衚珟は非垞に長い間調敎する必芁がありたした。 20のifず正芏衚珟の雲の埌、スキルのようなものを倚少匕き出したした。 もちろん、もっずむンテリゞェントなこずもできたす。たずえば、すべおのスキルをマヌゞしたり、ストップワヌドでたくさん遊んだりできたすが、1日もかからなかったので、次の䜜業段階に進みたした。 デヌタセットの各空垭は抜象的な領域マネヌゞャヌ、アシスタントなどず比范されたため、各領域の最も䞀般的なスキルを蚈算したした。 次に、これらのスキルのベクトルの平均を取り、それを職業ベクトルず呌びたした。



ここで、たずえば、匁護士のトップ10のスキル







さらに、ナヌザヌがスキルを入力するず、同じ魔法ず正芏衚珟を䜿甚しお「実際の」私たちのスキルを匕き出し、ベクタヌを取埗し、平均しおコサむンを䜿甚しお職業ベクトルたでの距離を調べたす。 したがっお、スキルがどの領域に適合するかを知るこずができたす。 SuperJobは次のステップを予枬するこずにもっず興味があり、勝ちたいず思ったので、すべおのキャリアパスを取り、スキルのダむナミクスず職業の幎衚を調べるこずにしたした。 なぜなら 私たちは空垭で働いた経隓の各行を比范し、空垭は職業ず比范されたす-私たちにずっお、キャリアパスは時系列の職業のセットにすぎたせん。 1人の履歎曞の堎合は次のようになりたす。







その埌、「正しい」キャリアパスを特定したした。 これは私たちのプロゞェクトの䞭で最も興味深く泥だらけの郚分です。 事実は、キャリアの成長が䜕であるかはあたり明確ではないずいうこずです。 特に、コヌドでのキャリア成長の感芚を䌝える方法は理解できたせん。 ハッカ゜ン終了の7時間前の長い議論の埌、珟圚の職業からの移行頻床に応じお職業レベルを割り圓おるこずが決定されたした。



たずえば、CEO-レベル10、ドラむバヌ-レベル1。そしお、次のようになりたした。







興味深い問題がここに隠されおいたす-それは人々が垞に私たちのパラダむムで開発するわけではないこずがわかりたす。 そしお、時には圌らはマネヌゞャヌや銀行家になった埌にドラむバヌになったり、履歎曞に完党なナンセンスを曞いたりしたす-そしお私たちは互いに関係のない40の空宀を取埗したす。 したがっお、キャリアパスの劥圓性を確認するために、いく぀かの条件を蚘述する必芁がありたした。



-パスは、予枬可胜な数の遷移たずえば、3から8を取る必芁がありたす。

-次の各䜍眮は、前の䜍眮ず䞀臎しない堎合、1〜3レベル高くする必芁がありたす。



キャリアパスを受け取ったら、珟圚の職業からパスを構築し、ナヌザヌのスキルに基づいお空垭を掚奚できたす。



スキルマップの䜜成の䟋





耇数の受賞者のプロゞェクトの説明



カナッペ



私たちの仕事は、特定のプロゞェクトのチヌムを空垭の圢で集めるこずでした。



私たちは2぀の䞻芁な基準に埓っおチヌムを線成したした。すべおの必芁なスキルず互換性を関心ごずにカバヌしたす。



resume2vecのカスタム実装は、空垭に適した人を「スマヌトに」怜玢するために䜜成されたした。 次のように機胜したす。



  1. 履歎曞付きのデヌタセットからスキルを解析し、
  2. 頂点がサマリヌであり、゚ッゞがそれらの間の類䌌性であるグラフを䜜成し、 この蚘事で説明されおいるnode2vecテクノロゞヌを䜿甚したす 。 2番目の郚分では、VKontakteを解析し、サブスクリプションずナヌザヌグルヌプによっお関心を刀断するチャットボットを䜜成したした。


チヌムアップ



履歎曞チヌムを線成するサヌビスに取り組みたした。 デヌタベヌスの人々は、コンピテンシヌによっおフィルタリングされ、ランク付けされたした。 人間の分析では、関心事に関する質問ぞの回答が䜿甚され、word2vecを䜿甚しお回答がベクトル化され、フィルタヌされた回答の䞭で最も近くなりたした。 ApplyMagicSauce APIを䜿甚しお、同じ問題に基づいおOCEANスキヌムに埓っお远加のタむプが決定されたした。 就業経隓合蚈に察する幎霢の比率もランキングに䜿甚されたした。 各人の最終的な速床は、これら3぀のパラメヌタヌの加重合蚈です。



いいね



先進的な䌁業では、プロゞェクトコヌドの品質を監芖する必芁がありたす。 倖郚の専門家が優れた分析を提䟛できたす。 この分析が最も有甚であるためには、専門家の胜力がチヌムの胜力ず䞀臎するこずが必芁です。 これを行うために、機械孊習を䜿甚しおコンテンツず説明のプロゞェクトの類䌌床を決定するコヌド分析甚のプラットフォヌムを開発したした。



ここたで読んで、他のプロゞェクトずそのプレれンテヌションに粟通したい堎合は、ここにようこそ、ここでは、研究監督者を遞択し、チヌムの効率を高め、メンタヌメンティをマッチングするためのサヌビスプロトタむプを芋぀けるこずができたす。



パヌトナヌのコメント
「ハッカ゜ンの初日は、参加者が技術的な問題だけでなく、日々の困難を克服するず信じられおいたせんでした。 それでも、この芏暡のフォヌラムは、萜ち着いた創造的な雰囲気を䜜り出すのにあたり圹立ちたせん。 最終点に達した30チヌムすべおが、チェックポむント䞭に寒さ、飢え、有害な専門家に察凊したこずを嬉しく思いたす。 2日目、堎合によっおは、チヌムのアむデアを保存できなかったようで、専門家は評䟡に恥ずかしがりたせんでした。 翌日、私たちは数時間のうちに文字通りプロゞェクトが認識を超えお倉化し、新しい論理的で興味深い圢匏を獲埗しおいるこずに驚きたした。 それは私たちにずっお非垞に興味深い経隓でした。 䞻催者チヌムずすべおの参加者の成功に感謝したす。



゚レナ・アレクサンドロワ、IPI研究所の開発郚長、 BusinessChainプロゞェクトからの特別ノミネヌトの著者。



「ハッカ゜ンに自発的に参加するこずにしたした。 スヌパヌゞョブオフィスでアリヌナむリヌナずの䌚議の埌、30分で決定が䞋されたした。 私たちは長い間、ハッカ゜ンを開催するずいうアむデアを育おおきたした。その瞬間、私たちは星が集たったず刀断したした。このむベントは、新しいメカニズムを砎り、すべおの萜ずし穎を研究する良い出発点になりたす。 そしお、サンゎ瀁だけで十分でした。 非垞にスプリントの甚語から始たり、絶えず倉化する組織のむンプットで終わり、その存圚は掚枬するこずさえ困難であり、垞に商業分野でのみプレヌしおいたす。 盎接のコマヌシャルストヌリヌから職業指導やボランティアの指瀺たで、SJが開発する倚くの指瀺があるため、タスクを蚭定するための倚くのオプションがありたした。 キャリアパスの問題に぀いおは合意したした。圌らが私たちがすでに取り組んでいるこずをどのように実珟できるか、圌らが私たちに新しいビゞョンを䞎え、私たちが芋逃しおいるものを瀺すこずができるかどうかは興味深いものでした。 賞金の芏暡に぀いおは、合意額を3か所に分けようずしたずころ、決定がすぐに䞊方に倉曎され、「ugい」結果になりたした。 おそらく、すべおの論理法則に察する私たちの決意に察するボヌナスでした。数週間ですべおを成し遂げるこずができたした。「䜕メヌトル、郚屋、貌ったり、貌り付けたり、接続したりできたす。」 ようやくオヌプニングデヌに達したずき、プロセスずメカニズムに぀いお䜕も知らないこずに気付きたしたが、その頃には私たちず同じくらい叀い友人がいたした申し蚳ありたせんが、アレナ、すべおが可逆的であるこずを願っおいたす、 48時間すべおを匕きずっおくれたした。 そしお、2人玠晎らしい、善良な人、そしお善良な人が2日間サむトで䜜業した堎合、機械孊習なしで占いず予枬を48時間行いたした。 次の各チェックポむントは、スケヌルを「すべおが玠晎らしい-すべおが消えた」ずいう反察方向に倉曎したした。 決勝たでに、誰がお気に入りだったかはすでにわかっおいたしたが、2䜍ず3䜍で予想倖に「行き詰たり」たした。 私たちはすでにピッチを決めたしたが、正しい遞択をしたこずを願っおいたす。 芁するに、これらはゞェットコヌスタヌずホラヌルヌムでした。 䞀般的に、魅力は成功であり、私たちはそれが奜きだった。 私たちは「どうしおはいけないか」に぀いお倚くのこずを孊び、偉倧な人に䌚い、そのようなメカニズムを䜿甚しおタスクを実行できるこずに぀いお倚くを理解したした。 私たちはそれを繰り返し、それがクヌルになるこずを知っおいたす。」

Julia Sharapova、 SuperJob Pressサヌビスマネヌゞャヌ。






All Articles