データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。 このリリースには多くの興味深いビデオがあります。 多くの資料がデータエンジニアリングのトピックに当てられています。 このリリースには、プログラミング言語RおよびPythonのコードの実用的な例が多数あります。 いつものように、多くの資料が機械学習アルゴリズムに専念しています。
データ分析および機械学習資料
- D3フレームワークを使用した視覚化
人気のあるD3 JSフレームワークを使用したデータの視覚化に関する短い記事。 - 自分の画像検索
著者は、Pythonでの彼自身の開発について話しています。これにより、ローカルコンピューターで画像を簡単に操作できます。 - Alex Smolaがスケーラブルな機械学習について語る
これは、ピッツバーグの機械学習サマースクール(MLSS '14)で行われた一連の講義の別の講義です。 このビデオレクチャーでは、機械学習の分野を含むコンピューターサイエンスの分野で有名な専門家であるAlex Smola(Googleの研究者、カーネギーメロン大学の教授)が、機械学習におけるスケーリングの非常に興味深い重要なトピックに触れています。 - ヤフーの目から見たコンテンツ消費の未来
人工知能と機械学習の分野におけるYahooの将来の計画に関する興味深い記事。 - Rの21のナビゲーションツール
Rプログラミング言語用の21種類のナビゲーションツールの便利なセットで、誰にとっても便利です。 - この人物からのFacebook環境での人工知能技術の開発
Yann LeCunnに関する興味深い記事-データ分析と機械学習の分野で最も有名な専門家の1人。DeepLearningの創設者の一人であり、現在Facebookで機械学習技術の開発に携わっています。 - データ分析の主要な研究者のリスト
Microsoft Academic Searchによるデータ結果の処理に基づいた、人気のあるポータルKDnuggetsのデータ分析およびデータサイエンスの分野における主要な研究者および科学者の興味深いリスト。 - 大きなファイルからレコードのサブセットを選択する
プログラミング言語Rで大きなファイルを使用する場合、データセット全体からのレコードの小さなランダムなサブセットを使用する方が便利なことがよくあります。 この短い記事では、ファイルからレコードのサブセットを抽出するためのサンプルコードを提供します。 - IPythonを使用したApache Spark
Apache SparkとIPythonの統合に関するClouderaブログの短い記事。 - PyStruct機械学習ライブラリ
機械学習用のライブラリ、つまりPythonプログラミング言語を使用した構造化学習。 このライブラリは、一般的な機械学習ライブラリscikit-learnとの設計の類似性に焦点を当てて作成されました。 - Vowpal Wabbitを使用したクイックラーニング
Microsoft Technet Machine Learning Blogのオープンソースの機械学習システムVowpal Rabbitに関する小さな記事。MicrosoftResearchによって開発され、Microsoft Azure MLクラウドベースの機械学習プラットフォームと統合できます。 - データ分析に関する今年の前半の最高のビデオ
この記事では、IBM Big Data&Analytics Hubポータルにあった2014年前半の最高のビデオのリストを見つけることができます。
- QuickML機械学習ライブラリ
Javaプログラミング言語を使用した機械学習用の興味深いライブラリ。 - クラウド内のSAS
この記事では、AmazonのAWSクラウドでのSASの動作、およびSASプラットフォームと一部のAWSサービスの統合について簡単に説明します。 - 38誰もが読むべきデータ分析記事
このトピックに興味がある人にとって興味深いデータ分析に関する38の記事の優れたリスト。 - グラフの軸に傾斜ラベルを作成する方法
グラフの軸に傾斜ラベルを作成する方法は、プログラミング言語Rの標準の視覚化ツールを使用するときによく発生する問題です。この記事には、さまざまな傾斜角で軸のラベルを作成できる小さなコード例があります。 - 機械学習スキルを向上させる方法
機械学習スキルを向上させる方法についての簡単な言語で書かれた素敵な小さな記事。 - データ分析ソフトウェアの比較
ソフトウェア製品(R、MATLAB、SAS、STATA、およびSPSS)のさまざまな統計分析ツールの組み込みサポートの比較表。 - Hadoopファミリーの18のコアツール
Hadoop周辺の新しいツールの数は急速に増加しており、この方向ですべての新製品を追跡することは非常に困難です。 この記事では、主要な18のリストと、それぞれの簡単な説明を見つけることができます。 - R言語用のSemPlotライブラリ
semPlotライブラリを使用する小さな例。これは、構造方程式モデリング(SEM)データを視覚化するために設計されており、変数間のさまざまな複雑な関係を調べることができます。 - 囚人のジレンマ:Rの例
プログラミング言語Rを使用したゲーム理論「囚人のジレンマ」からの根本的な問題の実装の興味深い例 - いくつかの基本的な統計
Pythonプログラミング言語の例を使用した統計からの簡単な操作のいくつかの例。 - SASからSQLiteへのデータの変換
SAS形式からSQLite形式にデータを変換するための便利なPythonコード例。 - GrapherR:R用のGUI視覚化システム
GrapherRはRプログラミング言語用のライブラリで、さまざまなデータを視覚化できますが、非常に重要なのはこのライブラリに独自のGUIがあることです。 - 畳み込みニューラルネットワーク
この出版物は畳み込みニューラルネットワークのトピックに当てられており、この興味深く人気のあるトピックに関する材料と理論にかなり深く浸っています。 - ディープラーニングを試してみませんか?
この記事は、ディープラーニングの人気のあるトピックに焦点を当てていますが、ディープラーニングのトピックをよりよく理解できるようにする、このトピックに関する有用で興味深いリソースのセットです。 - OpenMLの簡単な説明
機械学習コンテストに参加できるOpenML機械学習ポータルの人気の高まりに関する短い記事。 - PythonとPandasを使用した探索的データ分析
PythonとPandasを使用した研究データ分析に関する非常に興味深い記事で、Kaggleで人気のある「タイタニック」データセットに基づいたコード例を示します。 - 機械学習インフラストラクチャの構築
非常に簡単なプレゼンテーションスタイルのこの興味深いビデオで、ジョシュ・ウィリス(Clouderaのデータサイエンス担当シニアディレクター)は、現在Clouderaで働いていることと、多くのデータを含む生活環境での機械学習の使用について説明します。アカデミックな機械学習よりも難しい。 - CDH 5.1の新機能:HDFSの読み取りキャッシュ
この記事では、CDH 5.1の新機能であるHDFSの読み取りキャッシュについて説明します。これにより、HDFSを使用するシステムの読み取り速度が大幅に向上する可能性があります。 - Rの非線形分類
プログラミング言語Rの例を使用した8種類の非線形分類
前号: データ分析と機械学習に関する最も興味深い資料の概要No. 8(2014年8月4〜11日)