👨🏿‍🎨 ✍🏽 💱 データ分析と機械学習に関する最も興味深い資料の概要32（2015年1月19〜25日） 💆 🎭 🚵🏽

データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。

全般

Andrewsチャートで多次元データを視覚化する
マイクロソフトがRevolution Analyticsを購入
ビッグデータに関する最高のSlideShareプレゼンテーション -KDnuggets.comから少し分析したビッグデータに関する最も人気のあるSlideShareプレゼンテーションのランキングの更新バージョン。
データサイエンティスト：5つの必須スキル
15種類の優れたデータ視覚化
研究者は、分散デバイスグループ用の機械学習ネットワークを明らかにしました
コンピューターは、アタリとポーカーをプレイすることにより、がんと糖尿病を治療する方法を学びます
過去20年にわたるコンピュータービジョンアルゴリズムの開発の歴史
レコメンダーシステムの構築（パート1）
人工ニューラルネットワークとディープラーニングに関するいくつかの言葉
スケーラブルな機械学習アルゴリズムの構築

機械学習の理論とアルゴリズム、コード例

scikit-learnの概要-この投稿では、scikit-learn機械学習ライブラリの概要を説明します。
データの整理：ケーススタディを使用した分析用のデータセットの準備
ディープラーニングの視覚化は、ディープラーニングの仕組みをより深く理解するのに役立つ素晴らしい記事です。
k-meansメソッドによるクラスタリング：すべての費用を支払う必要があります -著者がk-meansクラスタリングアルゴリズム（k-means）の複雑さについて説明している小さな好奇心の強い記事です。
たたみ込みニューラルネットワークについて
リカレントニューラルネットワークへの深い没入
カーネルPCAアルゴリズムの概要
顔認識機械学習は、Pythonプログラミング言語用のscikit-learnライブラリを使用した顔認識に機械学習アルゴリズムを使用する良い例です。
初心者向けテキスト分析：文書分類
畳み込みニューラルネットワークトレーニングゲームGo
モデルのパフォーマンス（パート2） -この記事では、Analytics Vydhyaのブログの著者が、予測モデルのパフォーマンスを評価するというトピックを続けます。
caretEnsembleの概要は、caretEnsembleライブラリに関する有用な記事であり、プログラミング言語Rの一般的な機械学習ライブラリキャレットのモデルにアルゴリズム合成（Ensembleメソッド）を適用することができます。
わかりやすい言葉での決定木については、Vidhya Analyticsブログの決定木についての短い説明です。
Pythonでのデータ分析 -Pythonプログラミング言語を使用してデータを分析するための便利なコード例。
Jetpack：Dockerの機械学習ツール
Pythonをビッグデータ分析に使用する際の開発者の大きな間違い
ランダムフォレストを使用し、MLlibでブーストする例
Pandas Toolkitは、Pythonプログラミング言語用のPandasライブラリの有用なコード例の短いリストです。

機械学習コンテスト

オンラインコース、トレーニング資料、文献

スタンフォード大学のMining Massive Datasetsオンラインコースが開始されます -1月31日にCourseraで、スタンフォード大学のMining Massive Datasetsオンラインコースの2番目のセッションが開始されます。
書評：Apache Sparkによる高度な分析
無料の電子書籍：H2O and R -H2O機械学習プラットフォームとプログラミング言語Rでの使用に関する無料の本。

動画

博士によるランダムフォレストの紹介 Nando de Freitas-この投稿では、人気の機械学習アルゴリズムであるDr. Nando de Freitas（UBCコンピューターサイエンスの非常勤教授、オックスフォードの常勤教授）。

データ工学

Surus：NetflixのHadoopでの新しいオープンソースデータ分析プロジェクト

レビュー

前号：データ分析と機械学習に関する最も興味深い資料の概要No. 31（2015年1月12〜18日）

データ分析と機械学習に関する最も興味深い資料の概要32（2015年1月19〜25日）

全般

機械学習の理論とアルゴリズム、コード例

機械学習コンテスト

オンラインコース、トレーニング資料、文献

動画

データ工学

レビュー

More articles: