
データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。 いつものように、機械学習アルゴリズムに関する資料があります(ディープラーニングを含む)。 人気のあるPython用Scikit-Learn機械学習パッケージに関する実践的な記事。 R言語の実用化に関する記事がありますが、多くの資料がデータエンジニアリングのトピックに当てられています。 人気のあるプロジェクト「Google Brain」と「Project Adam」に関する興味深い記事があります。
データ分析および機械学習資料
- Google Brainについて [EN]
非公式には「Google Brain」と呼ばれているGoogleの研究プロジェクトに関する興味深い考え。 - Microsoftの「Project Adam」人工知能システム [EN]
「Prjoject Adam」と呼ばれるMicrosoft Researchの新しいプロジェクトに関するかなり大きな記事。 ある程度、このプロジェクトは、プロジェクト「Google Brain」に対するマイクロソフトの反応と呼ぶことができます。 - 機械学習は現代の科学者の顕微鏡です。 CERN Yandexテクノロジーが選ばれる理由 [RU]
この記事では、YandexとCERNの連携、およびCERNの作業におけるクラウドテクノロジーと機械学習の使用について説明します。 - 正および負の値の対数変換 [EN]
統計データ変換に関する短い記事。 - Earl Hathawayが分散GBM機械学習技術について語る(ビデオ) [EN]
このビデオでは、Earl Hathaway(0xdataのCTO)が分散GBM(グラディエントブースティング)について語っています。これは、データ分析のコンテストでよく使用され、実用的なアプリケーションでも役立つ一般的な機械学習手法です。 - Hadoopの7つの銀行利用 [EN]
銀行セクターのデータ分析におけるHadoopファミリー製品の7つの可能な用途の短いリスト。 - スタートアップの明確化 [EN]
人工知能と機械学習Clarifyの分野での新しいスタートアップについての小さな興味深い話です。Clarifyはまだソフトウェア大手のいずれにも買収されておらず、パターン認識と画像処理の分野で非常に興味深い研究を行っています。 - Apache Sparkによる財務リスク評価 [EN]
Apache Sparkを使用した金融リスクの評価に関するClouderaの記事。 - R命名規則 [EN]
プログラミング言語Rでの命名規則の議論。この言語では、この言語で知られているように、標準に大きな問題と不確実性があります。 - Python Scikit-Learnを使用したアルゴリズムパラメーターのチューニング [EN]
Python用の一般的な機械学習ライブラリであるscikit-learnの操作に関する継続的な議論。 この場合、アルゴリズムのパラメーターの調整に焦点を当てます。 - NoSQL、ビッグデータ、機械学習のリソースリスト [EN]
データ分析のさまざまな領域(分散コンピューティング、グラフデータベース、時系列分析、データの視覚化、検索エンジン、その他の領域)のリソースの大規模なリスト。 - Javaを使用した機械学習 [EN]
Javaプログラミング言語を使用した機械学習のためのテクノロジーと製品の簡単な概要。 - Microsft Azure Machine Learningの概要
機械学習用の新しいクラウドベースの製品であるMicrosoft Azure Machine Learningの簡単な紹介。現在はパブリックプレビュー段階です。 - Darpa Learning Computers [EN]
Darpaプロジェクトに関する記事。自己学習型コンピューターとそのアプリケーションの技術を開発することを目的としています。 - 人気のあるデータサイエンスマイクロブログ [EN]
データサイエンスに関するTwitterの小さなマイクロブログ分析。 - 無料の機械学習ブック15冊 [EN]
機械学習に関する15の無料電子書籍のリスト。 - 8データ分析ブログ [EN]
データ分析に焦点を当てた8つの優れたブログのリスト。 - 機械学習リソースリスト [EN]
便利な機械学習リソースのすばらしいリスト。 - 10のディープラーニングのヒント [EN]
Deep Learning Machine Learningを使用して結果を改善するための10の小さなヒント。 - データ分析のPythonの基本:ライブラリとデータ構造
この記事では、Pyhtonおよび追加のライブラリを使用してデータを分析する最初の手順について説明します。 これは、このトピックに関する議論の続きです。 現在の記事は、ライブラリとデータ構造に関するものです。 - 深層学習と自然言語処理 [EN]
自然言語処理におけるアルゴリズムのディープラーニングスイートの適用に関する優れた記事。 - サンプルサイズについて [EN]
基本統計に基づく引数を使用したサンプルサイズに関する小さな記事。 - 機械学習における文字のスケーリングと正規化について [EN]
scikit-learnを使用した機械学習における機能のスケーリングと正規化に関する有用な記事。 - Rのベクトル [EN]
プログラミング言語Rでベクターを操作することに関する短い記事。 - 機能学習に関する冒険 [EN]
パターン認識における機械学習の使用に関するAndrej Karpathyの面白い話。 - Python Scikit-Learnを使用したデータの準備
Python用の一般的な機械学習ライブラリであるscikit-learnの操作に関する継続的な議論。 この場合、データの準備、つまりデータの再スケーリングプロセスに焦点を当てます。 - Python Scikit-Learnを使用した機能選択プロセス
Python用の一般的な機械学習ライブラリであるscikit-learnの操作に関する別の記事。 この場合、機械学習における特徴選択プロセスについて説明します。 - 機械学習を使用して、Googleのデータセンターのパフォーマンスを向上させる [EN]
Googleがデータセンターのパフォーマンスを向上させるために機械学習をどのように使用したかについての、奇妙な小さな記事 - 言語評価R [EN]
IEEEのプログラミング言語の最新ランキングでは、Rはすべての言語の中で9位であることがわかります。 - Scikit-Learnを使用したデータのダウンロード [EN]
人気のあるPython機械学習ライブラリscikit-learnを使用したデータのロードに関する、小さいながらも役立つ記事。 - 人気のあるRライブラリの依存関係
人気のあるR言語パッケージが依存するライブラリー(ggplot2、data.table、plyr、knitr、shiny、xts、lattice)と、このリストの人気のあるライブラリーがすべてインストールされた場合に最終的にインストールされるライブラリーの数に関する短い記事。 - Apache Crunchで時系列を処理する
Javaコードの例でApache Crunchを使用した時系列の操作に関するClouderaのブログ投稿。 - Rを使用した2014年ワールドカップ勝者予測 [EN]
セミファイナルペアに基づくR言語を使用して、2014年ワールドカップの勝者を予測する試み。 これで、予測が実現したかどうかをすでに確認できます。 - Rでのコードの改善に役立つ3つのこと [EN]
Rのコードを改善するための実用的なヒント - データサイエンティストおよびデータエンジニア [EN]
データ分析における2つの役割を比較した短い記事:データサイエンティストとデータエンジニア。 - R言語の2x2テーブルの高速機能 [EN]
標準のテーブル関数ではなく、R言語で2x2テーブルを作成するための独自の高速化関数を作成する小さな例。 - HDFSおよびMapReduceのプレーン言語 [EN]
Hadoop分散ファイルシステム(HDFS)やMapReduceなど、Hadoopのこのような基本的なコンポーネントの説明は、かなり単純な言語です。 - データ分析スペシャリストへのインタビュー [EN]
データ分析のスペシャリストとしてのインタビューから何を期待するかについての短い記事。 - データ折り紙:データサイエンススクリーンキャスト [EN]
Data Origami Webサイトの小さな概要。データ分析と機械学習のトピックに関するさまざまなレベルの複雑さのスクリーンキャストを多数見つけることができます。 確かに、このサイトには毎月の有料購読があります。
前号: データ分析と機械学習に関する最も興味深い資料の概要4(2014年6月23日-7月7日)