🚌 🥛 🎌 データ分析と機械学習に関する最も興味深い資料の概要No. 19（2014年10月20〜26日） ✋ 🤞🏾 👩🏽‍🍳

データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。

全般

IBM、ニューヨークの新しいWatsonテクノロジー実装プロジェクトとWatson Group本社を発表
ロシアAIカップ2014の結果
データを話すようにする方法
私的調査と分析におけるビッグデータの役割
Yandex.Mapsでヒートマップを作成できるようになりました
HDConf Conference：フォトビデオスライドレポート
50以上の顔認識ライブラリ

50種類を超えるライブラリ、顔検出/認識APIをアプリケーションで使用できます。
金融セクターのビッグデータの紹介（パート5）

insideBIGDATAポータルの銀行および金融セクターでのビッグデータの使用に関する一連の記事の5番目と最後の部分。
アナリストポジションのインタビューでの一般的な質問（パート2）

アナリストの立場についてインタビュー中に尋ねられたいくつかの一般的な質問を含む一連の記事の第2部。
新しいJava Machine Learning Library

Javaプログラミング言語Datumbox用の新しいオープンソースの機械学習フレームワークの長所と短所について説明する記事。
MITの科学者はビットコインの価値を予測できる

MITの科学者グループに関する記事で、ビットコインの為替レートの短期的な変動を予測する回帰に基づいた予測モデルを作成し、2か月で投資を2倍にした。
インメモリコンピューティングの概要（パート4）

insideBIGDATAからのインメモリコンピューティングに関する一連の記事の続き。この場合、インメモリコンピューティングのパフォーマンスの測定に焦点を当てます。
インメモリコンピューティングの概要（パート5）

insideBIGDATAのインメモリコンピューティングに関する一連の記事の5番目と最後の部分。この場合、製品GridGain Data Fabricに焦点を当てます。
SQLまたはNoSQL？

現在、データウェアハウスのテクノロジーの選択などの人気のある質問に対する著者の考えを反映した別の小さな記事。
Apache LuceneとTikaによる情報検索（部1）

Apache LuceneとTikaライブラリーを使用した情報検索のトピックに関する一連の記事の最初の部分。
Apache LuceneとTikaによる情報検索（部1）

Apache LuceneおよびTikaライブラリーを使用した情報検索のトピックに関する一連の記事の第2部。
Apache LuceneとTikaによる情報検索（部1）

Apache LuceneとTikaライブラリーを使用した情報検索のトピックに関する一連の記事の第3部。
データサイエンスに関する15の時代を超越した記事

DataScienceCentralポータルの15の記事のリスト。1〜2年前に公開されましたが、その人気と関連性は失われていません。

機械学習の理論とアルゴリズム、コード例

ベンフォードの法則とその下にある分布
マルコフ確率場
機械学習アルゴリズムを習得する方法

さまざまな機械学習アルゴリズムを研究する問題に適切にアプローチする方法に関するブログMachineLearningMasteryの著者からの5つの素晴らしいヒント。
非線形回帰

非線形回帰の概念のかなり簡単な説明。
分散Rの最初の検討

Distributed Rと呼ばれるHP Labsの非常に興味深いプロジェクトに関する短いメモ。
MKLがRevolution Rオープンパフォーマンスを改善する方法

前回のレビューでは、Revolution R Openの発表へのリンクがありました。この記事では、このバージョンのプログラミング言語Rの実装の詳細について、つまり、Intel Math Kernel Library（MKL）を使用して一部の操作の操作を加速することについて説明します。
RapidMinerによるテキスト分析（部1）

RapidMinerを使用したテキスト分析に関する一連の記事の最初の部分。
RapidMinerによるテキスト分析（部2）

RapidMinerを使用したテキスト分析に関する一連の記事の第2部。
ニューラルネットワークの概要（パート2）

ブログAnalytics Vidhyaのニューラルネットワークの操作に関するかなり簡単な説明。

機械学習コンテスト

データハッカソンとは何ですか？

MITの後援の下、9月中旬に開催されたデータハッカソンに関する興味深いビデオ。
Kaggleのコンペティションで最終評価用のモデルを選択する方法

機械学習コンテストの参加者の1人による、Kaggleでのコンテストの最終評価に適切なモデルを選択する方法についての非常に役立つ記事。
機械学習のヒント

機械学習コンテストの最終モデルの選択に関する前のトピックの議論を続けると、この場合、これはこの興味深い質問に関する人気のあるMachineLearningMasteryブログの著者の見解です。

オンラインコース、トレーニング資料、文献

オンラインコース「データの視覚化。 基本
edXの新しいMITビッグデータコース

少し前に、MITの興味深いMITイニシアチブ、つまり、MIT Professional EducationのedXでのビッグデータの課題への取り組みコースの最初のセッションの立ち上げに関する出版物がMITのWebサイトに掲載されました。
データサイエンスに関する3つの優れた無料書籍

データサイエンスに関する3冊の書籍と、それぞれの簡単な説明のセット。無料で入手できます。
書籍データの流encyさ

著者からの新しい好奇心book盛な本「Data Fluency」のレビュー。
信号処理の基礎とフーリエおよびウェーブレット信号処理の本

人気のブログNuit Blancheの著者による、興味深い書籍「信号処理の基礎とフーリエおよびウェーブレット信号処理」に関する短いメモ。

動画

ファジー検索アルゴリズムのスケーリング

Apache Cassandraを使用して銀行セクターの顧客データの類似度を比較することによるファジーマッチング機能のスケーリングに関するトピックに関するCassandra Summit 2014会議のKen Kugler（Scale Unlimited社長）からの興味深いレポート。
データの操作にApache Sparkを使用する

この投稿では、Apache Spark専用のさまざまなビデオを紹介します。

データ工学

Microsoft DocumentDB：記事1、はじめに
Microsoft DocumentDB：記事2、リソース、および概念
カイリンby eBay

Kylinと呼ばれるeBayの興味深いオープンソース製品-SQLインターフェイスとHadoopベースのOLAPを備えた分散分析エンジン。
企業部門のHadoop

企業部門でのApache Hadoopの使用に関する興味深いインフォグラフィック。
Apache Kafka AWS負荷テスト

Apache KafkaのAWSストレステストの結果を示す興味深い記事。
シャーディングトラップ（パート2）

人気のあるNoSQLリポジトリMongoDBでのシャーディングの使用に関する複雑な一連の記事の第2部。
シャーディングトラップ（パート3）

人気のあるNoSQLリポジトリMongoDBでのシャーディングの複雑さに関する一連の記事の第3部。

レビュー

DataScienceCentralウィークリーダイジェスト

DataScienceCentralポータルからのデータ分析記事の定期的なダイジェスト。
今週のベストマテリアル（10月12〜18日）

KDnuggetsポータルからのデータ分析に関する今週の最高のコンテンツ。
データマイニングニュース

10月8日のデータマイニングのトピックに関する興味深いリソースの小さなリスト。
Freakonometrics No. 177の最も興味深い資料

人気のFreakonometricsポータルからの最も興味深い資料のコレクション。
Freakonometrics No. 176の最も興味深い資料

人気のFreakonometricsポータルからの最も興味深い資料のコレクション。
Freakonometrics No. 175の最も興味深い資料

人気のFreakonometricsポータルからの最も興味深い資料のコレクション。
高いスケーラビリティのハイライト

人気の高いスケーラビリティポータルの最も興味深いHighScalabilityマテリアルの概要。
ベストコンテンツ：NoSQLゾーン（10月17〜24日）

NoSQLで人気のあるDZoneポータルからの最高の資料のコレクション。

前号：データ分析と機械学習に関する最も興味深い資料の概要No. 18（2014年10月13〜19日）

データ分析と機械学習に関する最も興味深い資料の概要No. 19（2014年10月20〜26日）

全般

機械学習の理論とアルゴリズム、コード例

機械学習コンテスト

オンラインコース、トレーニング資料、文献

動画

データ工学

レビュー

More articles: