![](https://habrastorage.org/files/4cf/086/e49/4cf086e49a2b4f66a420085544e4c2e9.jpg)
データ分析と機械学習に関する最も興味深い資料のレビューのこの問題は、データサイエンスをテーマとしたオンラインコースに完全に当てられています。 前号では、まもなく開始されるオンラインコースのリストが提示されました。 この号では、データ分析に関する最も興味深いオンラインコースを収集しようとしました。 一部のコースが既に終了していることは注目に値しますが、これらのコースのほとんどについては、すべてのトレーニング資料のアーカイブを見ることができます。
このレビューは、ジョンズ・ホプキンス大学のコースラにある一連のコースから始まります。これらのコースは、1つの専門分野「データサイエンス専門分野」に組み込まれています。 これらは、9つの公式専門コースと2つの追加のMathematical Biostatistics Boot Camp 1および2であり、これらは公式には専門に含まれていません。 これらのコースのセット全体が定期的に新たに開始され、一般に、独自のスペシャライゼーションプロモーションスケジュールを柔軟に構築できることに注意することが重要です。 ほとんどのコースは4週間続きます。 R言語は、このコースセットの主要なプログラミング言語です。 以下は、ジョンズホプキンス大学のデータサイエンス専門分野のコースのリストです。
- データサイエンティストのツールボックスは、専門分野の基本コースであり、さまざまなデータ分析スペシャリストツールの概要に専念しています。 教材の量は少なく、コースは3〜4時間で完了できます。
- Rプログラミングは、専門化の基本コースであり、プログラミング言語Rを使用した作業の基本に専念しています。
- データの取得とクリーニングも専門化の基本コースであり、さらなる分析のために生の入力データを準備および処理するという非常に重要なトピックに専念しています。
- 探索的データ分析 -このコースは、R言語およびラティスやggplot2などの一般的な視覚化パッケージを使用したデータ分析とデータ視覚化の研究に専念しています。
- 再現性のある研究 -このコースでは、 再現性のある研究などのデータ分析における重要なトピックについて説明します。 R言語のknitlrパッケージと、マークアップ言語のR Markdownを検討します。
- 統計的推論 -正式には、コースは統計的推論のトピックに専念しますが、実際には統計と確率理論の基礎に関するコースです。 非常にしわくちゃで混oticとした形式ですべて提出されました。 この専門分野で最も物議を醸すコースの1つ。 今後のバージョンでコースが真剣に改訂されることを願っています。
- 回帰モデル -コースは回帰分析のトピックに焦点を当てています。 また、このコースには、教材開発のテーマに関する質問と、コースの作成者が生徒のコメントに注意を払い、今後コースを真剣に改訂することを期待しています。
- 実用的な機械学習 -このコースは、機械学習の基礎に焦点を当てています。
- データ製品の開発 -このコースは、データ分析のトピックにおける最新製品の開発に特化しています。 ShinyやSlidifyなどの一般的なフレームワークが考慮されます。
- 数学生物統計学ブートキャンプ1-ジョンズホプキンス大学の生物統計学コースの最初の部分は、データサイエンスの専門分野への非公式の追加であり、統計学と確率理論の基礎を十分にカバーしています。
- 数学生物統計学ブートキャンプ2-ジョンズホプキンス大学の生物統計学コースの第2部は、データサイエンスの専門分野への非公式の追加であり、統計学と確率理論の基礎を十分にカバーしています。
次に、データアナリストに必要な一般的なスキルの向上に役立つコースを見ていきます。
- HadoopとMapReduceの紹介 (Udacity)-このコースでは、Hadoopと大規模なデータセットの操作の基本に焦点を当てます。
- MongoDBによるデータラングリング (Udacity)-このコースでは、MongoDBなどの人気のあるNoSQLデータベースのデータの操作に焦点を当てます。
- Pythonによるプログラミングの基礎 (Udacity)-このコースでは、データアナリストの間で急速に人気が高まっているPythonプログラミング言語の基礎に焦点を当てています。
- データベース入門 (コースセラ-スタンフォード大学)-このコースでは、リレーショナルデータソースの使用、および他の一般的なデータストレージ形式(XML、JSON)の使用について説明します。
それでは、確率論と統計学のコースに移りましょう。 もちろん、これらの分野の知識は、データ分析のスペシャリストであると主張する人には役立ちます。 多くのコースがデータ分析に関連するさまざまな側面をカバーしているため、場合によっては、コースをカテゴリに分類することはまったくarbitrary意的です。 以下は、このカテゴリのコースのリストです。
- 確率と統計 (カーンアカデミー)は、カーンアカデミーの統計と確率理論の優れた基本的なセットです。
- ケースベースの生物統計学入門 (コースセラ-ジョンズ・ホプキンス大学)-このコースでは、生物統計学の例を使用して、統計と確率理論の基礎をアクセシブルな形式で提供します。
- 確率的グラフィカルモデル (クールセラ-スタンフォード大学)は、確率理論の短期コースです。
- 統計:データの意味を理解する(Coursera-University of Toronto)は、統計の基礎に関するもう1つのコースです。
- データ分析と統計的推論 (Coursera-Duke University)は、データ分析の優れたコースであり、確率理論と統計の基礎の概要を提供します。
- Statistics One (Coursera-Princeton University)は、統計の基礎に関する優れたコースです。 素材はアクセス可能なレベルで提示され、素材をマスターするためにリスナーからの特別な知識は必要ありません。
- Statistics in Medicine (Stanford Online)-医学の例に基づく統計の基礎。
- Statistics for Medical Professionals(CME) (Stanford Online)-医学の例に基づいた統計の基礎。
- Stat_2.1x-統計の概要:記述統計 (edX-BerkleyX)は、統計と確率理論に関する一連のコースの最初の部分です。 最初の部分は、記述統計に専念します。
- Stat_2.2x-統計入門:確率 (edX-BerkleyX)-統計と確率理論に関する一連のコースの第2部。 2番目の部分は、確率論の基礎に専念します。
- Stat_2.3x-統計入門:推論 (edX-BerkleyX)-統計と確率理論に関する一連のコースの第3部。 3番目の部分は、統計的推論のトピックに専念します。
- 6.041x確率入門-不確実性の科学 (edX-MITx)-MITの確率論のコース。
- Explore Statistics with R (edX-KIx)は、統計プログラミング言語Rを使用した新しいコースです。このコースの最初のセッションは2014年9月9日に始まります。
- Intro to Statistics (Udacity)は、統計の基礎に関する別のコースです。
- 統計 (Udacity)は、確率理論と統計のかなり単純なコースです。
以下は、機械学習、自然言語処理、ニューラルネットワーク、推奨システム、ソーシャルネットワーク分析、人工知能などのデータ分析のトピックのさまざまな側面に焦点を当てたコースのリストです。
- データ分析 (コースセラ-ジョンズホプキンス大学)-R言語を使用したデータ分析の8週間のコース。
- データサイエンス入門 (コースセラ-ワシントン大学)-コースは8週間続きます。 データサイエンスの基礎に関する最も人気のあるオンラインコースの1つ。
- Machine Learning (Coursera-University of Washington)は、10週間続くワシントン大学の優れた機械学習コースです。
- 機械学習 (コースセラ-スタンフォード大学)は、スタンフォード大学のAndrew Ng教授が教える最も有名な機械学習コースの1つです。 コースは10週間続きます。 コースは非常にシンプルで明確であり、成功するために特別な知識は必要ありませんが、機械学習の多くの分野をカバーしています。
- 自然言語処理 (コースセラ-スタンフォード大学)は、スタンフォード大学で最も人気のあるオンライン自然言語処理コースの1つです。
- レコメンダーシステムの紹介 (Coursera-ミネソタ大学)-レコメンダーシステムの紹介。 これは、コースが慎重に作成されたということではありませんが、このコースにはそれほど多くのコースがないため、推奨システムのトピックに関係する人にとっては興味深いかもしれません。
- 機械学習のためのニューラルネットワーク (Coursera-トロント大学)-機械学習におけるニューラルネットワークの使用に関するコース。
- 自然言語処理 (Coursera-コロンビア大学)は、自然言語処理に関する別のコースです。
- ソーシャルネットワーク分析 (コースセラ-ミシガン大学)-このコースは、ソーシャルネットワークデータ分析の一般的なトピックに焦点を当てています。
- 統計学習 (Stanford Online)-スーパーバイザーによる機械学習の基礎に関するコース(教師あり学習)。
- SABR101x Sabremetrics:野球分析入門 (edX-BUx-Boston University)-このコースでは、スポーツ統計(この場合は野球)の分析に基づいて、データサイエンスとビッグデータの多くの側面を説明します。
- PH525xのゲノミクスデータ分析 (edX-HarvardX)は、データ分析に関する非常に簡単なコースです。
- 15.071xアナリティクスエッジ (edX-MITx)-データ分析と機械学習に関する優れた教材を備えたコース。
- Learning From Data (edX-CaltechX)は、最高の機械学習コースの1つです。 機械学習の多くのトピックにアクセスできます。
- CS188.1x人工知能 (edX-BerkleyX)は、おそらく人工知能に関する最も興味深いオンラインコースの1つです。 このコースでは、Pythonプログラミング言語を使用します。
- Intro to Data Science (Udacity)-Udacityによるデータサイエンスの紹介。
- 機械学習1 —教師あり学習(Udacity)は、Udacityの一連の機械学習コースの最初の部分です。 最初の部分は、教師あり学習のトピックに専念します。
- 機械学習2 —教師なし学習 (Udacity)は、Udacityの一連の機械学習コースの2番目の部分です。 2番目の部分は、教師なしの学習(教師なし学習)のトピックに専念します。
- 機械学習3 —強化学習 (Udacity)は、Udacityの一連の機械学習コースの3番目の部分です。 3番目の部分は、一般的な機械学習手法である強化学習に専念します。
- 探索的データ分析 (Udacity)-R言語を使用したデータ視覚化のコース。
- ロボット用人工知能 (Udacity)-無人車両の例を使用した人工知能プログラミングのトピックの紹介。
- 人工知能入門 (Udacity)-人工知能の基礎に関するコース。
- CS109データサイエンス (ハーバード)-ハーバードエクステンションスクールのデータサイエンスの基礎に関するビデオ講座
前号: データ分析と機械学習に関する最も興味深い資料の概要No. 2(2014年6月16〜23日)