データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。
全般
- Andrewsチャートで多次元データを視覚化する
- マイクロソフトがRevolution Analyticsを購入
- ビッグデータに関する最高のSlideShareプレゼンテーション -KDnuggets.comから少し分析したビッグデータに関する最も人気のあるSlideShareプレゼンテーションのランキングの更新バージョン。
- データサイエンティスト:5つの必須スキル
- 15種類の優れたデータ視覚化
- 研究者は、分散デバイスグループ用の機械学習ネットワークを明らかにしました
- コンピューターは、アタリとポーカーをプレイすることにより、がんと糖尿病を治療する方法を学びます
- 過去20年にわたるコンピュータービジョンアルゴリズムの開発の歴史
- レコメンダーシステムの構築(パート1)
- 人工ニューラルネットワークとディープラーニングに関するいくつかの言葉
- スケーラブルな機械学習アルゴリズムの構築
機械学習の理論とアルゴリズム、コード例
- scikit-learnの概要-この投稿では、scikit-learn機械学習ライブラリの概要を説明します。
- データの整理:ケーススタディを使用した分析用のデータセットの準備
- ディープラーニングの視覚化は、ディープラーニングの仕組みをより深く理解するのに役立つ素晴らしい記事です。
- k-meansメソッドによるクラスタリング:すべての費用を支払う必要があります -著者がk-meansクラスタリングアルゴリズム(k-means)の複雑さについて説明している小さな好奇心の強い記事です。
- たたみ込みニューラルネットワークについて
- リカレントニューラルネットワークへの深い没入
- カーネルPCAアルゴリズムの概要
- 顔認識機械学習は、Pythonプログラミング言語用のscikit-learnライブラリを使用した顔認識に機械学習アルゴリズムを使用する良い例です。
- 初心者向けテキスト分析:文書分類
- 畳み込みニューラルネットワークトレーニングゲームGo
- モデルのパフォーマンス(パート2) -この記事では、Analytics Vydhyaのブログの著者が、予測モデルのパフォーマンスを評価するというトピックを続けます。
- caretEnsembleの概要は、caretEnsembleライブラリに関する有用な記事であり、プログラミング言語Rの一般的な機械学習ライブラリキャレットのモデルにアルゴリズム合成(Ensembleメソッド)を適用することができます。
- わかりやすい言葉での決定木については、Vidhya Analyticsブログの決定木についての短い説明です。
- Pythonでのデータ分析 -Pythonプログラミング言語を使用してデータを分析するための便利なコード例。
- Jetpack:Dockerの機械学習ツール
- Pythonをビッグデータ分析に使用する際の開発者の大きな間違い
- ランダムフォレストを使用し、MLlibでブーストする例
- Pandas Toolkitは、Pythonプログラミング言語用のPandasライブラリの有用なコード例の短いリストです。
機械学習コンテスト
- Kaggle入門:データサイエンス初心者向けガイド
- 新しい機械学習コンペティション「どれくらい雨が降った?」 - 新しい機械学習コンペティション「どれくらい雨が降った?」数日前にKaggleで始まった
オンラインコース、トレーニング資料、文献
- スタンフォード大学のMining Massive Datasetsオンラインコースが開始されます -1月31日にCourseraで、スタンフォード大学のMining Massive Datasetsオンラインコースの2番目のセッションが開始されます。
- 書評:Apache Sparkによる高度な分析
- 無料の電子書籍:H2O and R -H2O機械学習プラットフォームとプログラミング言語Rでの使用に関する無料の本。
動画
- 博士によるランダムフォレストの紹介 Nando de Freitas-この投稿では、人気の機械学習アルゴリズムであるDr. Nando de Freitas(UBCコンピューターサイエンスの非常勤教授、オックスフォードの常勤教授)。
データ工学
レビュー
- Rの世界から興味深い(2015年1月19〜25日)
- DataScienceCentralウィークリーダイジェスト(1月26日)
- DataScienceCentralからの最高のリソースのダイジェスト(1月23日)
- KDnuggets.comの今週のベストコンテンツ(1月11〜17日)
- MyDataMine.comからのデータサイエンスニュース(1月22日)
- Data Elixirの今週のベストリソース(No.19)
- R1Softからの最高の資料の毎週のコレクション(1月23日)
- 高スケーラビリティに関する最も興味深い資料(1月23日)
前号: データ分析と機械学習に関する最も興味深い資料の概要No. 31(2015年1月12〜18日)