データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。 このリリースは非常に膨大であることが判明し、データエンジニアリングに関する多くの資料が含まれています。 KDD 2014カンファレンスからはますます多くの資料が登場しますが、いつものように、最近のImageNet大規模視覚認識チャレンジ(ILSVRC)に関する記事など、さまざまな機械学習コンテストに関する記事があります。 また、プログラミング言語RおよびPythonには非常に多くのコード例があります。 非常に好奇心urious盛なオンラインコース「計算ファイナンスと金融計量経済学入門」についての言及があります。
データ分析および機械学習資料
- ILSVRC結果の分析
Googleチームが1位になった毎年の画像処理コンテストである最近のImageNet大規模視覚認識チャレンジ(ILSVRC)の結果の分析。 - MongoDbデータモデリングガイド
少し前、MongoDBのData Modeling AdviserがDaprota Webサイトに公開されました。これは、NoSQL MongoDbデータベースのデータをモデリングするための非常に便利なガイドです - KaggleでのAVITO.ruコンペティション
著者は、KaggleでのAVITO.ruコンテストへの参加中に得られた経験と、コンテストの他の参加者が使用した問題を解決するためのさまざまなアプローチの分析について語っています。 - テキスト分析用の辞書を作成するためのフレームワーク
テキスト分析および非構造化データの操作に関する一連の記事の続き。 この記事では、著者はテキストデータの分析で辞書を作成する問題を解決するための可能なアプローチについて話します。 - 画像処理アルゴリズムの改善
Googleチームが1位になり、昨年の結果を2倍にした年次画像処理コンテストに関する短い記事。 - オンラインコース計算ファイナンスおよび金融計量経済学入門
ごく最近、Courseraでオンラインコースが開始されました。これは、統計やRプログラミング言語に興味のある人や、金融分野で統計手法を使用することに興味のある人に役立ちます。 - 単純な言語の線形回帰について
かなり単純な言語で書かれた線形回帰の簡単な紹介。 - Stinger.next:HadoopとHiveによるSQLの改善
Hortonworksブログの新しいStinger.next製品の計画に関する記事。Hadoopを使用する場合、SQLクエリの品質インジケーターの多くが大幅に改善されます。 - テキスト分析にグラフデータベースを使用する
Neo4jおよびGraphifyグラフデータベースを使用して、ディープラーニングアルゴリズムを使用してテキストを分類する例。 - KDD 2014スライド
KDD 2014のいくつかの公演のスライド。 - Microsoft Azure MLのMachine Learning Studioの概要
この記事では、Machine Learning Studioについて説明します。これにより、Microsoft Azure MLを機械学習するための新しいクラウドベースの製品を操作できます。 - Googleでの深層学習
Googleの機械学習における進歩、深層学習に関する小さなニュース記事。 この記事では、ディープラーニングアルゴリズムの実装の技術的な詳細については触れていません。 - ShinyTree:jsTree + shinyTree
Rプログラミング言語用のshinyTreeライブラリーとjsTree JavaScriptライブラリーを使用した短い視覚化の例。 - PythonとPandasを使用してExcelドキュメントを作成する
Pythonプログラミング言語とPandasライブラリを使用してExcelドキュメントを作成する方法を示すサンプルコード。 - NoSQLトレンド:2014年8月
さまざまなインターネット採用サイト(実際、SimplyHired)の主要なNoSQLシステムの現在の傾向。 - 私のお気に入りのグラフィックス
この記事の著者は、さまざまなタイプのソースデータを簡単かつ明確に視覚化できるいくつかのタイプのグラフについて説明しています。 - 「ビッグデータ、大規模機械学習」コースのビデオ講義
2013年に行われ、14週間続いたビッグデータ、大規模機械学習コースのビデオ。主なインストラクターはYann LeCunとJohn Langfordでした。 - サンプリングエラーと非サンプリングエラー
サンプリングエラーと非サンプリングエラーの2つの概念の違いを説明する短い記事。 - Rによる機械学習
MachineLearningMasteryブログの著者は、プログラミング言語Rで機械学習アルゴリズムの適用をすぐに開始する方法を説明しています。 - Apache Sparkのエキサイティングな年
Apache Spark製品の人気が過去1年間でどのように進化したかについての短い記事。 - Apache SparkでMapReduceクエリを翻訳する方法
Clouderaブログの役立つ記事。MapReduceクエリを成長中のApache Sparkに変換し、これら2つのアプローチの概念の違いを理解する方法について説明しています。 - ビッグデータとは?
ビッグデータとは何ですか。40人以上の専門家がBerkleyブログでこの質問に答えています。 - R Caretを使用した予測モデルの精度の評価
人気のあるMachineLearningMasteryブログの著者によって説明されている、Rプログラミング言語用のCaret機械学習ライブラリで利用可能な予測モデルの精度を評価する5つの方法。 - Hadoopエコシステムの最高のマテリアルダイジェスト
Apache Hadoopエコシステムに関するClouderaの8月のブログ投稿。 - 予測分析の概要
insideBIGDATAからの新しいシリーズの記事の最初の部分、今回は予測分析について。 - R MarkdownでのGoogleチャートの使用
R MarkdownドキュメントでGoogle Chartを使用する例を示す短い記事。 - データサイエンティストとは誰ですか?
私はデータサイエンティストが何をするかを説明する良い試みのようです。 - D3.jsでテンプレートを使用する
JavaScriptプログラミング言語の一般的なD3視覚化ライブラリのテンプレートを使用します。 - 6データサイエンティストの活動
データサイエンティストが日々の仕事で対処しなければならない活動の6つの異なる領域について語る興味深い記事。 - NoSQLストレージを選択するための9つのヒント(パート1)
NoSQLストレージの正しい選択方法を説明する一連の記事の最初の部分。 - 高性能材料の概要
人気のあるHighScalabilityポータルからの最も興味深い高性能素材の毎週のダイジェスト - Apache Sparkを使用したApache Pig
Apache PigとApache Sparkの使用に関するClouderaのブログの興味深い記事。 - Rの累積頻度図
プログラミング言語Rとggplot2ライブラリを使用して、累積的なプライベートダイアグラムを構築する例。 - EBImageによる画像解析
プログラミング言語RとEBImageライブラリを使用して画像を操作する例。 - Rで2次元図を作成する5つの方法
プログラミング言語Rを使用して2次元図を作成する5つの例 - 「線形」回帰に関するいくつかの言葉
プログラミング言語Rの例を使用した線形回帰に関する興味深い記事。 - RからMongoDbを操作する
プログラミング言語RからNoSQL MongoDbデータベースを操作する方法に関する有用かつ最新の記事。 - 機械学習とデータ分析のニュースレター
データ分析と機械学習の分野のすべてのニュースを追跡することはしばしば困難です。 人気のあるMachineLearningMasteryブログの著者は、データサイエンスの分野から最新ニュースを取得する作業を簡素化できるニュースレターの短いリストを提供しています。 - Rの通知
プログラミング言語Rのスクリプトが終了したときに通知を受け取ることができるサンプルコード。 - R通知エラー
プログラミング言語Rでスクリプトを実行するときにエラーが発生した場合に通知を送信できるようにする別のサンプルコード。 - 統計モデリングと機械学習
統計モデリングと機械学習の興味深い比較。 - 段階的なニューラルネットワーク
ニューラルネットワークがどのように機能するかを示す良い例です。 - 興味深いデータセット
それぞれの簡単な説明を含むいくつかの異なるソーシャルメディアデータセット。 - 決定木の実装例
Pythonプログラミング言語での決定木の実装例。
前号: データ分析と機械学習に関する最も興味深い資料の概要11(2014年8月25日-9月1日)