オンラインコースからの人々の流出を止め、同時にハッカソンに乗る方法

オンラインコースは、その利便性とアクセシビリティに加えて、多くの学生が成功している点で、スコアリングが非常に簡単であるという事実で有名です。 リスナーはさまざまな理由で得点することができます-コースが理解できない、締め切りがない、ポイントを獲得できなかった、Fallout 4が出てきた-誰もが言い訳をしています。 しかし、言い訳はできません。人がコースを離れると、世界は開発者やデータ分析のスペシャリストを失い、ヒーローが費やした時間と時間も失われます。







ここで最も難しいタスクは、どのユーザーが逃げるのかを判断することであり、それらを知ることで、「警告してから武装する」という損失を防ぐことはすでにはるかに簡単です。







記事の最後で、問題の解決策を使用してデータ分析のためにハッカソンに到達する方法を学習します。







画像









ユーザーの離脱の問題は明確に定義されておらず、実際の結果を誰も正確に予測することはできないため、機械学習法が役立ちます。

通常、あらゆる種類の銀行や通信の状況で機械学習法を使用して流出を予測することを耳にします。 同様に、教育プロジェクトでも同様の問題が発生します。







そのような状況を防ぐことを学ぶことは非常にクールです-リスナーがコースを離れようとしている場合を予測し、可能であれば、リマインダー、アドバイス、クッキーなどで返してください。







Stepik.org-ロシアの大規模な教育-オンラインコースのプラットフォーム。ユーザーの流出を予測するタスクのデータを提供しました。







もっと厳密に言えば、ユーザーのデータとコースのフレームワーク内でのアクティビティに基づいて、彼がコースを完了するかどうかを判断したいと思います。 「コースを終了する」という言葉は、「合格するために必要なポイントを獲得する」と理解されるべきです。







各コースは一連のステップです-レッスンの最小限の部分で、それぞれ「訪問」および「合格」できます。 いくつかのステップは、訪問するとすぐに渡されます-たとえば、理論的な資料、他の場合はいくつかのタスクを完了する必要があり、自動的にチェックされ、ステップのポイントは答えが正しい場合にのみカウントされます。







ユーザーがコースを修了するかどうかに影響する兆候を検索する分析の自由度を高めるために、ユーザーデータは最も詳細な形式で提供されます:ユーザーが各アクションを完了した時間を示します-ビデオを開き、確認のためにコードを送信するか、テストの質問に答えます。







ユーザーの出発を予測する従来の方法は、最初に、コースを完了した人と「落ちる」人を区別する標識を見つけることです。







そのような兆候の例:









通常、一度に複数の機能を使用し、それらを何らかのルール(デシジョンツリーなど)と組み合わせて使用​​することをお勧めします。 いくつかの標識が組み合わされても、ユーザーが去るという理想的な予測が得られないことが予想されます。







異なるアプローチを比較するには、正式な品質指標を使用する価値があります。 そのようなメトリックの例は、精度です。アルゴリズムがユーザーがコースを受講するかどうかを正しく推測した場合の割合です。 別の例は、 f1_metrics-精度とリコールの中間-分類品質の2つの主要な特性です。 精度-「正確性」、すべての真の実例のうち、マークされた真の実例の割合。 リコール-「リコール」、同じ真の、正しくマークされた例の共有。ただし、すでに言及されたすべての例の中にあります。







競争



このタスクのために、Kaggle.comプラットフォームが選ばれました。そこでは、 競争が開始さました。それは、悟りの真の道で失われた人々に指示するという大きな目標に加えて、 GoToHackハッカソン決勝の予選段階の第3部です。 これは、学生と学童向けの3日間のイベントで、2016年12月にRVCの支援を受けて開催されます。







言及された競争に加えて、ストリームの初心者に与えられたのと同じデータで潜在的なハッカソン参加者に2つのより単純なタスクが提供されました。 最初の電撃任務は完全に教育的なものですが、2つ目は競技会のように、コースの改善に関する有用な観察を行います。







時々、生徒が何度もステップに戻ることがあります。非常に興味深いことがあったか、初めて理解するのが困難でした。 そのようなブロックを見つけることは、コースの複雑すぎる部分を特定するために重要であり、その後、リスナーは教材を理解しなくなる可能性があります。 実際、2回目の電撃戦では、最も「戻りのステップ」を見つける必要があります。 ブリッツの詳細については、選択ページをご覧ください。







次に、流出予測問題の基本的なソリューションについて説明します。 最も単純なケースでは、現在の瞬間に踏まれたステップの数を単純に考慮するように選択されました。 したがって、各ユーザーについて、予測に使用される1つの数値が考慮されます。 ベースラインは非常にシンプルで、機械学習にあまり詳しくない人でも理解できるでしょう。 秘密のリンクをクリックすると、コンテスト自体が利用可能になります。 コンテストの終了まで1週間以上ありますので、みなさんはまだ参加する機会があります。 参加者がハッカソンの選択に合格するだけでなく、実際のデータで実際に適用可能な結果を​​示すことを願っています。







ハッカソンの詳細



これは、データ分析用の2番目のGoToHackです。 最初のものは 2016年2月成功し、成長する時が来ました。 より多くの参加者、より多くの賞金、より古い参加者。 今回は、2つのストリームのいずれかで学童と20歳未満の生徒を招待します(高齢者は記事の最後をご覧ください)。 最初のストリームはデータ分析と機械学習のマスタークラスを保持しますが、高度なものはすぐに準備されたデータセットと戦うか、独自のアイデアを実装します。







データセットといえば。 ハッカソンは教育と人事のトピックに専念しているため、パートナーからのタスクが適切です。 たとえば、HeadHunterは空席のデータベースと少しの要約を提供しますが、SkyEngは時系列のユーザーアクションとレッスンの音声録音を提案しています。







一般的に、12月9日から11日にモスクワで関心を寄せるすべての人を待っています。 急いで、選択の最後まで一週間が残っています。 賞品には、ガジェットだけでなく、たとえば、GoToデザインスクールやベイジアンサマースクールでディープラーニングで勉強したり、大学入学時にボーナスでNTIオリンピックの決勝戦に参加したりすることも含まれます。

申し込みは11月27日まで受け付けられますここでタスクについて詳しく知ることができます







ちなみに、20歳以上で業界で実際の経験をお持ちの方は、ハッカソンでキュレーター/チームコンサルタントになることをお勧めします。 詳細はこちら








All Articles