この期間の中心的なケースは、DMPシステムの作成です。 DMP(データ管理プラットフォーム)は、ユーザーのインターネットログを分析し、ネットワーク上のユーザーの行動に基づいて、これらの人々にさまざまなプロパティを割り当てるか、特定のクラスとして分類します。 たとえば、適切に調整されたDMPシステムは、人の性別と年齢を判断し、その人がガジェットの男性なのか、高級ファッションブランドのファンなのかを調べることができます。 このケースは、Data-Centric Allianceと共同で開発していますが、ビッグデータを使用して広告キャンペーンを設定しています。
チームワーク
Open Dayでは、学生がチームでケースに取り組む方法について話しました。 不幸な人もいました:「なぜこれが必要なのか! 私が弱虫で同じチームに乗って、彼が私を引き戻すとどうなりますか!?」 他の人たちは、「十分な知識がありません。強力な開発者がいるチームで何をしますか?」と心配しています。 論理的ですか? はい。しかし、実際のビッグデータ分析は個人ではなくチームスポーツであるため、ここにいる人にとっては簡単ではありません。 しかし、我々はリスナーを戦闘条件に可能な限り近い条件に浸すという目標を設定しました。
チームは月に一度変更され、すべての生徒はプロジェクトでの貴重なチームワークの経験だけでなく、クラスメートとの良好なつながりも得られます。 IT企業の創設者、テクニカルディレクター、経験豊富な開発者が私たちと一緒に勉強するようになりました。そのため、これらのつながりは有名な教授に会うのと同じくらい役に立ちます。
4ステップのデータ管理プラットフォーム
最初の4週間で、生徒はDMPシステムを作成し、毎週グループが1つのサブタスクを実行して、ケース全体を進めます。
計画は次のとおりです。
- 最初の週:各リスナーは小さなHadoopクラスターを個別にデプロイします
- 2週目:1 TBのWebログを前処理して、HBaseテーブルに正しくロードする必要があります
- 3週目:ログの分析を開始します-これまでのところ、機械学習なし。 事前に決定したルールを使用して、ユーザークラスを選択します。
- 4週目:Map-Reduceでの機械学習。 Webログを分析するためのDMPシステムの構築!
ポイント、評価、バッジ
私たちは、教師と雇用主が生徒の勤勉さをナビゲートするのに役立つポイントと評価のシステムを作成しました。
各サブタスクには少なくとも2つの難易度があります。1つ目は単にそれを解決すること、2つ目は追加条件で解決することです。 そのような成果に対して、特別なバッジと追加ポイントを提供します。 新しい仕事を見つけるために目標を設定した人々に注意してください。そのような「成果」は、パートナーの雇用主にとって非常に興味深いものです。
最終的なDMPシステムでは、特定の精度係数を使用してユーザーのポートレートを計算する必要があります。 これはビジネスにとって興味深い挑戦であり、Data-Centric Allianceのスタッフは、適切に機能するソリューションを作成するチームをトレーニングするコストの4分の1を補う用意ができています。 優れたソリューションを提示できるチームは、最大50%の報酬を受け取ります。 R&D Data-Centric Allianceの責任者であり、コースの最初の月のパートタイムリーダーであるAlexander Petrov氏によると、分類精度を5%向上させると、広告の収益が30%増加します。
教室と実際の日
授業は週3回、火曜日、木曜日、土曜日に開催されます。 毎週火曜日と木曜日-教室活動。 彼らは(昔ながらの大学の講義とは対照的に)仕事への学生の関与を最大限にするように設計されており、すべてが問題の解決と事例の分析に基づいています。 教室の目的は、問題を解決するための方法論を説明し、必要なすべてのツールがどのように機能するかを示し、理論と基本概念を批判的に見ることです。 私たちの経験では、この形式は深い理解と優れた作業スキルを提供します。
ちなみに、このフォーマットを使用すると、オンラインの視聴者と積極的に交流できます。 このコースでは、オンラインの参加者にカメラをオンにして作業することを要求することにしました。 もちろん、リスナーは恥ずかしがり屋で、evenすることさえありますが、付属のカメラは袖を通って作業する機会を残しません。
毎週火曜日、チームは1週間のタスクを受け取ります。 土曜日、相談日。 Digital Octoberの扉は午前11時から開かれ、チームは協力して問題の解決に取り組むことができます。 午後4時から、セミナーチューターのオフィスアワーが開始されます。これにより、チームにアドバイスしたり、特定の質問に答えたり、誰かが行き止まりになった場合に助けたりすることができます。 タスク自体は、コードを特別なプラットフォームにアップロードすることで自動的に確認できます。
タスク、テスト、コロキウム
クラウドリソースに関するすべての問題を解決します。クラウドリソースは、各チームに対してAWSにデプロイされます(アマゾンウェブサービスのパートナーになったため、リスナーに優れたコンピューティングパワーを提供できます)。 4つのサブタスクのそれぞれを解決するために、1週間が与えられます。これは「ソフト期限」です。 チームがこの期間内にタスクに合格しなかった場合、あと1週間で降伏できますが、30%の罰金が科せられます。 いくつかの締め切りに間に合わない人は、修了証明書を受け取る機会を失います。
これらの不快な瞬間を最小限に抑えるために、渡された資料に関するコロキウムが2週間ごとに開催されます。 ここでグループに追いつき、追加ポイントを獲得できます。
ご覧のとおり、強制収容所はありませんが、すべてがかなり厳しいです。 私たちは、自分の能力を確信している専門家を卒業したいと考えています。 あなたはまだプログラムにサインアップすることができます。