データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。
全般
- サービスとしての機械学習-無料でクラウドで
- Microsoft Azureビッグデータ
- 負荷の高いサイトの分析方法
- DeepMindは、人間の短期記憶を繰り返すコンピューターを作成します
- データサイエンスを選択するときに答える必要がある3つの質問
コメント付きの3つの重要な質問と、データサイエンスをテーマにしたトレーニングプログラムを選択する際に回答する必要がある質問を含む便利な記事。 - 22データサイエンスのヒント
この記事では、有名なデータアナリストであり、Data Science Centralポータルの作成者であるVincent Granvilleから22のデータサイエンスのヒントを見つけることができます。 - データモデルの柔軟性
データモデルのこのような重要なプロパティについて、柔軟性とは少し考えました。 - Facebookのデータの操作に関する未解決の問題
同社のFacebookブログの記事では、データの処理に関する同社のさまざまな未解決の問題や質問について説明しています。 - ビッグデータの原則を実装するための10の推奨事項
人気のビッグデータ分析ニュースポータルからの10の役に立つヒント。 - Azure ML CloudでRを実行する
MicrosoftのAzure MLクラウドでRを起動する可能性について説明する短い記事。
機械学習の理論とアルゴリズム、コード例
- 機械学習アルゴリズムの膨大なリストを制御する方法
人気のあるMachineLearningMasteryブログの著者は、多数のさまざまな機械学習アルゴリズムを理解するのに役立つヒントを提供しています。 - Hello World Machine Learning
ブログMachineLearningMasteryの著者による別の優れた記事は、初心者にとって興味深いものであり、機械学習にある膨大な数のアルゴリズムを理解するのに役立ちます。 - クラスタリングおよび分散コンピューティングモデル
さまざまなクラスタリング手法と、クラスタリングアルゴリズムからのデータを使用した分散コンピューティングモデルの使用の可能性に関するストーリー。 - 外れ値の検出-機械学習を使用して時系列分析の異常を検出する
機械学習とAzure MLを使用した時系列分析での異常の検出に関するMicrosoft Technet Machine Learningブログ記事。 - Rコードカバレッジ分析の単体テスト
testCoverageライブラリを使用したプログラミング言語Rでのユニットテストによるコードカバレッジレベルの分析に関する非常に興味深い記事。 - ALYIEN Text Analysis APIを使用したテキストトーン分析のツイート
この場合のテキスト分析に関する別の興味深い記事は、Twitterテキストの感情の分析に関する興味深い資料です。 - ニューラルネットワークの概要
現在、ニューラルネットワークのような興味深い人気トピックの基礎について説明する別の記事。 - 正規化されたロジスティック回帰の直感
正規化されたロジスティック回帰をよりよく理解するのに役立つ小さな記事。 - 主成分法の紹介
主成分分析法の基礎に関する小さな、良い記事。 - 基本結果の重要な役割について
MachineLearningMasteryブログの著者は、ベースラインの結果とは何か、なぜ重要なのかについて語っています。
機械学習コンテスト
- 1位:禁止コンテンツの探求
KatogleでのAvito.ruハント禁止コンテンツマシン学習コンテストの受賞者へのインタビュー。 - 次点:禁止コンテンツの探求
KatogleでのAvito.ru The Hunt禁止コンテンツマシン学習コンテストの準優勝者へのインタビュー。
オンラインコース、トレーニング資料、文献
- 大規模データセットのマイニングWebサイト
このサイトでは、このトピックに関する本へのリンクとさまざまなオンラインコースへのリンクを見つけることができます。
動画
- ハドリーウィッカム:dplyr入門(部1)
useRのHadley Wickhamパフォーマンス! 2014年、プログラミング言語Rの人気dplyrライブラリ専用。 - ハドリーウィッカム:dplyr入門(部2)
useRのHadley Wickhamによる2回目の記事! R.プログラミング言語用の人気のあるdplyrライブラリ専用の2014
データ工学
- HighLoad ++ 2014:LeoFSの例を使用した最新の分散オブジェクトストレージのデバイス(Alexander Chistyakov、Git in Sky)
次の高負荷システム開発者HighLoad ++ 2014の開発者カンファレンスの別のプレゼンテーション。これは、Git in SkyのAlexander Chistyakovによるプレゼンテーションです。LeoFSの例を使用した最新の分散オブジェクトストレージのデバイスです。 - HighLoad ++ 2014:シャーディング:パターンとアンチパターン(Konstantin Osipov、Alexey Rybak)
「シャーディング:パターンとアンチパターン」というタイトルのHighLoad ++ 2014会議を開いた別の興味深いレポートのスライド。 - Apache SparkとNeo4jを使用して大きなグラフを分析する
人気のあるApache SparkおよびNeo4j製品を使用して大きなグラフを操作する可能性について説明する記事。 - Netflix Dynomite-割り当てられていないデータベースを分散させる方法
NetflixのDynomiteオープンソースソリューションに関する興味深い記事。 - Flafka:イベント処理用のApache FlumeおよびApache Kafka
これらのレビューでは、Apache Kafkaの資料へのリンクが既にいくつかありました。この場合、これは、Apache KafkaとApache Flumeをイベント処理に使用することに関するClouderaのブログのかなり興味深い記事です。 - Hadoopの世界におけるNoSQL
Clouderaブログの興味深い記事で、Hadoopの世界でNoSQLがどのように使われているかについて。 - Spark StreamingとApache Hadoopを使用したリアルタイムセッション管理
Sparkストリーミングの機能の使用に関するClouderaブログの興味深い記事。 - ドキュメント指向データベースでデータをモデリングするための3つのヒント(パート1)
ドキュメント指向データベースのデータモデリングに関する記事シリーズの最初の部分。 - リレーショナルおよびNoSQLリポジトリの世界でデータをモデリングするための10のヒント
リレーショナルおよびNoSQLリポジトリの世界でデータをモデリングするための10のヒントを見つけることができる短い記事。 - Hadoop MapReduceの概要
Hadoop MapReduceの基本概念をよく説明している記事。
レビュー
- Data Elixirの今週のベストリソース
過去1週間にData Elixirが収集したさまざまなデータ分析関連資料へのリンク集。 - DataScienceCentralウィークリーダイジェスト
DataScienceCentralポータルからのデータ分析記事の定期的なダイジェスト。 - DataScienceCentralからの最高のリソースのダイジェスト
DataScienceCentralの最新の興味深い記事とリソースの良いリスト。 - 今週のベスト10素材
データサイエンスレポートポータルのデータサイエンストピックに関する今週のベスト10の資料。 - 今週のベストマテリアル(10月26日-11月1日)
KDnuggetsポータルからのデータ分析に関する今週の最高のコンテンツ。 - データマイニングニュース
11月5日のデータマイニングのトピックに関する興味深いリソースの小さなリスト。 - Freakonometrics No. 181の最も興味深い資料
人気のFreakonometricsポータルからの最も興味深い資料のコレクション。 - Freakonometrics No. 180の最も興味深い資料
人気のFreakonometricsポータルからの最も興味深い資料のコレクション。 - 高いスケーラビリティのハイライト
人気の高いスケーラビリティポータルの最も興味深いHighScalabilityマテリアルの概要。
前号: データ分析と機械学習に関する最も興味深い資料の概要No. 20(2014年10月27日-11月2日)