![](https://habrastorage.org/getpro/habr/post_images/6a3/ac1/fad/6a3ac1fad934cfa94e11412f97263f08.jpg)
私はあなたにデータ分析の世界からのニュースと役に立つ資料のダイジェストを提示します。 前のダイジェストは非常に人気があったので、私はそれらを定期的にすることにしました。 このような収集の頻度は、2週間に1回です。
今日の選択では、データ分析の統計と科学に共通するもの、誤った相関関係を検出する方法、および現代世界を支配するアルゴリズムを学習します。 さらに、機械学習法やNoSQLデータベースなどの小さなチートシートも入手できます。
理論
- NoSQLデータベースのリスト
NoSQLデータベースの完全なリスト。カテゴリごとの内訳と簡単な説明。 - ビッグデータ分析に適用される統計からの10のこと
この記事では、統計およびビッグデータ分析で使用される一般的なアプローチについて説明します。 - ビッグデータの誤った相関
偽相関と真相関の違いに関する別の記事。 6種類の相関が考慮されます。 - データ分析の進化
データ分析の専門家として自分自身を成長させる主なマイルストーンが強調されています。 私の意見では、この記事は最近データ分析に携わり始めたが、すでにこれについての基本的な理解を持っている人にとって有用だろう。 - Pythonはデータ分析言語のリーダーになりますか?
この記事では、データを分析するためのツールとしてのPythonの開発のダイナミクスを示しており、Pythonが現在非常に人気がある理由についても考察しています。 - 3つの興味深い、しかしあまり知られていないプログラミング言語
言語の簡単な説明があります:Julia、Scala、Erlang。 - 監視データウェアハウスの3つの傾向
この記事では、さまざまなソースからデータを取得すること、アナリストがデータに直接アクセスすること、およびデータを扱う速度を速めることの傾向を強調しています。 - ビッグデータプロジェクトの7つの基本ルール
ビッグデータの操作を開始するときに注意する必要があるポイントがリストされています。 - データアナリストのチームを構築する
この記事では、どのスペシャリストがチームに参加すべきか、そしてその理由を示しています。 基本的に、会話は約3人です。カスタマーサービススペシャリスト、コンテキストアナリスト、ビジュアライザーです。 - 何かを測定する前に尋ねるべき5つの質問
インジケーターの分析を開始する前に、自問するかダウンロードする必要がある質問を表示します。 - 小国でのライフデータ分析
この記事では、ベルギー、スイスなどの小国でアナリストとして働いているときの多くの困難とその解決方法について説明しています。 - Graphvizクックブック
Graphvizを使用してデータを視覚化するためのレシピ集。 - アナリスト向けの10のヒント
アナリストの専門家が、分析に役立つヒントを共有しています。 - OLAPでSQLを使用する場合の問題
この記事では、ビジネスインテリジェンスシステムを作成するときに発生する可能性のある問題について説明します。 - 先験的な確率と「予期しない」効果の有病率
p値の評価とその解釈に関する興味深い記事。 - マルコフ連鎖に基づく単純なベイジアンネットワーク
このようなネットワークを構築するためのPyMCの使用が示されています。 - データ構造のヘルプ
- データアナリスト:検索の停止、使用開始
データ分析が状態にない場合にデータ分析を置き換える方法を説明する興味深い記事。 - 正規分布で分析モデルを構築する
この記事では、このアプローチの利点について説明します。 - SASはコースを無料にします
SASについて知りたい人には朗報です。 - BigMLは機械学習を容易にします
- 5線形代数を学習するための優れたリソース
- 尖度分布の4つの重要な用途
- 言語対立データ分析 (EN)
- 顧客データから取得できる4つのもの
顧客に関するデータを収集および分析する利点について簡単に説明します。 - データ分析のための20のチュートリアル
- ニューラルネットワークは何を隠しますか? (RU)
- ニューラルネットワークは実際に何を隠していますか? (RU)
- 機械学習チートシート
チートシートはscikit-learnパッケージ用に作成されました。 - ディープラーニングとは
- 分析システムをゼロから構築するためのヒント
文学
- ビッグデータの世界での分析
さまざまな業界のデータ分析のガイド。 - 時間データの異常値検出
- 機械学習とデータ分析に関する15冊の書籍
- Rを使用した実践的データサイエンス
- ビッグデータコンピューティング
- 予測分析、データマイニング、ビッグデータ:神話、誤解、手法
- データマイニングと分析-基本概念とアルゴリズム (EN)
- 予測分析
- 実用的な機械学習-推奨事項のイノベーション (EN)
- アナリストが持つべき本
さまざまなツールを使用する練習
- IPython Notebookを使用した統計の調査
基本的なデータ分析手法を示すIPythonコンソールのセレクション。 そして、これらはすべて教科書の形で行われます。 初心者には、Pythonでデータ分析を学習することを強くお勧めします。 - ホームワールドチャンピオンシップでのブラジルの勝利
次回のワールドカップの勝者を予測する別の記事、今回はR - 隠れマルコフ連鎖を使用した音声認識
このタスクでPythonとそのパッケージを使用する方法を示します。 - クラスタリングを使用してプライマリイメージの色を定義する
OpenCVとPythonを使用してこのタスクを完了する方法について説明します。 - Node.jsとMongoDBの使用の概要
Node.jsを使用してMongoを操作する小規模でシンプルな例。 - PythonからGDELTを操作する
PythonからGDELTを操作するための公式チュートリアル。 - IPythonとplotly
ipythonでplotlyを使用する例。 ipythonノートブックコンソールとして設計されています。 - Rを使用したレコメンダーシステムの構築 (EN)
数行のRコードで簡単な推奨システムを作成する方法に関する短い記事。 - 100以上の分析データセット
データセットの小さな選択。 - R-Hadoop構成のチュートリアル
- データ分析に関するトレーニング資料の選択
教育ビデオ
- Python for Big Data Analytics
Pythonを使用してビッグデータを分析する方法を説明したビデオのセレクション。 - ビジネス分析の概要
ビジネスインテリジェンスの基礎に関するオンライン講義。 - scikit-learnとRabbitMQを使用したリアルタイム予測
その他の関連記事
- 世界を支配する10のアルゴリズム (RU)
現在最も頻繁に使用されているアルゴリズムに関するストーリー。 - ビッグデータ分析で受け入れられる頭字語のリスト
この記事には、ビッグデータに関する記事で最もよく見られる略語が含まれています。 - データ分析が健康を改善する方法
MyFitnessPalの科学部長へのインタビュー。 - 2014年の世界チャンピオン予測
この記事では、予測の概念について説明しています。また、方法論の説明へのリンクもあります(ちなみに、これは非常に美しく視覚化されています)。 - チェス進化研究
この記事では、チェスゲームの始まりが1850年から現在にどのように変わったのかという問題を検証します。 - 機械学習による災害モデリング
災害モデリング会社であるKatRiskのCEO、Dag Lohmannへのインタビュー。 - データ分析と統計-同じこと? (EN)
「データ分析は統計とどう違うのか?」という質問に答えるとき、著者は興味深い考えを持っています。 - 銀行が依然としてビッグデータに反対する理由
この記事では、さまざまな銀行家がビジネスに「ビッグデータ」を適用する方法についての質問に対する多くの回答を提供しています。 - Revolution R EnterpriseとSASパフォーマンスの比較
上記の分析システムの機能の比較が提示されています。 - 1か所で2億5千万の国際イベント (RU)
- アナリストと統計学者の対立
これらの2つのキャンプがどのように彼ら自身の間で戦っているのかについてのかなり面白い記事。 - デジタルデータ革命
ビッグデータが世界をどのように変えることができるかについてのエリック・シュミットの考え。