データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。 このリリースには、初心者向けの興味深い資料がたくさんあります。 興味深いビデオがいくつかあります。 データエンジニアリングのトピックに関する資料があります。 いつものように、いくつかの記事はデータ分析と機械学習に関連するコード例を扱っています。 そして伝統的に、いくつかの記事が機械学習コンテストへの参加のトピックに捧げられてきました。
データ分析および機械学習資料
- MIT Deep Learning Book
機械学習ディープラーニングの現在非常に人気のある分野でのMITの本。 この本はまだ完全ではありませんが、読者はすでに多くの章を利用できます。 - Rを使用したデータの処理
Rプログラミング言語を使用してデータを扱うすべての人に役立つ小さな本です。これは、ご存知のように、データ分析の専門家の多大な時間と労力を要する、前処理段階でのデータの処理とクリーニングに特化しています。 - 機械学習を学ぶハードな方法-ポニーストーリー
このビデオのNathan Taggart(New Relicのプロダクトマネージャー)は、機械学習をマスターするという彼のストーリーと、この困難なタスクで回避すべきミスを説明しています。 このビデオは、データ分析と機械学習の分野の初心者を対象としています。 - Rとは
Rプログラミング言語の小さな包括的な概要と利点と欠点の説明。 - 企業がビッグデータについて知っておくべきこと
多くの企業が、データを扱うためのアプローチを変更し、データサイエンスの現在の傾向にもっと集中する必要があるかもしれないと主張する記事。 - 非構造化テキストデータ分析ガイド
人気のあるポータルAnalytics Vidhyaの一連の記事の最初の部分。テキスト分析の興味深いトピックを取り上げています。 この記事では、基本的な問題と問題について説明します。今後の記事では、これらの問題の実装の詳細について説明します。 - Microsoft Mario Garziaによるデータ分析
MicrosoftデータアナリストのMario Garziaは、Microsoft Technet Machine Learning Blogの記事で、データサイエンスの現在の状態に関する興味深い洞察を提供しています。 - 機械学習コンテストに参加する5つのメリット
ブログMachineLearningMasteryの著者による別の興味深い記事。 今回は、Kaggleでの機械学習コンテストに参加することの利点についてお話します。 - googleVisライブラリを使用して時系列を視覚化する
少し前、googleVisバージョン0.5.5のリリースに関するニュースがリリースされました。 この短い投稿では、プログラミング言語RのgoogleVisライブラリを使用して時系列を視覚化するための非常に簡単なコード例を示します。 - Microsoft Azure DocumentDB
Azure DocumentDBと呼ばれるMicrosoftの新しいNoSQLデータベースに関する短い記事。 - トレーディングのための機械学習の使用(パート1)
トレーディングのための機械学習の使用の概要。 この一連の記事は、データ分析と機械学習に関する調査ですでに発表されています。 この場合、これは最初の部分のロシア語への翻訳です。 - パーティション化によるApache Hiveのクエリパフォーマンスの改善
Clouderaブログの、パーティショニングを使用してApache Hiveのクエリパフォーマンスを改善する方法に関する短い記事。 - スタンフォード大学-大規模データセットのマイニングがCourseraで新しいオンラインCourseraを発表
2014年9月29日にCourseraで、スタンフォード大学の非常に興味深いオンラインコース-Mining Massive Datasetsを開始します。 - パンダを使用した高速HDF5
Pythonプログラミング言語用のPandasデータ分析フレームワークのHDF5情報ストレージ形式を使用した例。 - ディープラーニングの興味深いリソース
有名なポータルKDnuggetsによってコンパイルされた、人気の機械学習技術であるディープラーニングに関するリソースのリスト。 - これはNoSQLとRDBMSではなく、ACID +外部キーと最終的な一貫性です
NoSQLおよびRDBMSデータウェアハウスについての好奇心の強い議論。 - Kaggleの問題を解決する例
人気のあるKaggle Predict Bike Sharing DemandのGradient Boosted Treesテクニックを使用した機械学習競争の可能なソリューションの例。 この例では、機械学習ツールGraphLab Createを使用します。 - ロジスティック回帰の視覚化
機械学習では、多くの場合、ロジスティック回帰が使用されます。 この短い投稿では、ロジスティック回帰の作業をアニメーション画像の形で視覚化しています。 - 機械学習とコンピュータービジョン(パート2) Microsoft Technet Machine Learning Blogの一連の記事の第2部では、パターン認識の問題を解決するための機械学習の使用とコンピュータービジョンテクノロジの使用について説明しています。 記事は小さく、このかなり複雑なトピックの詳細に飛び込むことなく、シンプルな言語で書かれています。
- Hadoopエコシステム
Hadoopエコシステムの基本的な要素の簡単な説明を提供する小さな役立つ記事。 - ビッグデータとは?
著者がビッグデータとは何かについて議論し、この用語の最も簡単な説明を提供しようとする興味深い小さな記事。 - Rで式を使用する
プログラミング言語Rで式()関数を使用することに関する興味深い記事。 - 教師あり学習機械学習フローチャート
多くの人は、教師による学習(教師あり学習)など、この方法の機械学習に精通しています。 フローチャート形式のこの短い投稿では、教師と一緒に教えるときの典型的なアクションのシーケンスを適切に視覚化しています。 - 21素晴らしいスケジュール
DataScienceCentralポータルのさまざまなタイプのグラフとチャートを使用したデータ視覚化の優れた例。 - Kaggleで成功する方法
Kaggleの機械学習コンテストで成功するための別の有用な記事。 - Courseraからのデータ分析の専門分野におけるCapstoneプロジェクトの発表
ジョンズホプキンス大学のデータサイエンススペシャライゼーションの最終段階に関するCapstoneプロジェクトを発表する小さな記事。 9つの専門コースすべてが正常に完了した場合、プロジェクトに接続できます。 - Sybil:Googleでの機械学習のスケーリング
この講演では、Tushar ChandraがGoogleでのSybilの運命について語っています。 SybilはGoogleの重要な研究プロジェクトであり、さまざまな機械学習アルゴリズムを実装して、スケーリングを可能にします。 この開発はGoogleで広く使用されています。 - データ分析のための4つの主要言語
人気のあるKDnuggetsポータルがデータ分析に使用される最も人気のある言語について実施したアンケートの結果。 - 機械学習のための数学
この記事は、機械学習の基本的な知識を習得するために必要な数学的スキルの問題に専念しています。 著者は、記事がドラフト版であり、今後追加情報が表示されることを示しています。 - ライブラリがRStudioでインストールされる場所
RStudioがライブラリをインストールする場所に関する奇妙な質問に関する短い記事。 - 44データ分析記事
DataScienceCentralポータルによってコンパイルされた最高のデータアナリストからの興味深い記事とリソースの選択
前号: データ分析と機械学習に関する最も興味深い資料の概要9(2014年8月11〜18日)