データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。
全般
- リスク保護機械学習システムアーキテクチャ
- リアルタイムストリーミング分析のためのSQLのようなクエリ
- Apache Spark 1.3の発表-Apache Sparkの新バージョンの機能の概要。
- 新しいバージョンR 3.1.3がリリースされました
- Apache Spark:スターライズ
機械学習の理論とアルゴリズム、コード例
- 機械学習-2.非線形回帰と数値最適化 -オーディエンスビューとターゲットアクションの統計が蓄積されます。この記事の出発点は彼女でした。 その中で、著者は非線形回帰(つまり、指数関数的)の例を簡単に検討し、その助けを借りて、ユーザー間で2つのグループを区別する変換モデルを構築します。
- この記事では、Pythonのメタネットワーク構造(MetaNetライブラリ)を使用して、メタネットワークをモデル化するツールが出現するためのいくつかの前提条件について説明します。
- Gnuplotによる視覚的な線形近似
- 深層学習装置の選択ガイド
- ディープラーニング、Curse of Dimension、および自動エンコーダー
- ディープラーニングを使用してテキスト情報を理解する
- Python:scikit-learn-数字以外の文字を使用した分類器のトレーニング
- 機械学習アルゴリズムの仕組み(パート1)。 人工ニューロンと単層ニューラルネットワーク
- Apache Flinkでの単純ベイズ分類器の実装
- 初心者のための機械学習(部1)
- 遺伝的アルゴリズムの説明
- Pythonデータ処理と機械学習。 プレゼンテーションとコード例
- Python k-meansクラスタリング
- Microsoft Azure Machine Learning Studioの概要
- Apache Sparkのパフォーマンスの改善(パート1)
- 重力クラスタリング:教師による新しい学習アルゴリズム。 説明と実装
機械学習コンテスト
オンラインコース、トレーニング資料、文献
- ロシア語に翻訳された機械学習に関するPeter Flachの本
- Courseraのオンラインコース:プロセスマイニング:Data Science in Action
- オンラインコース:テキスト検索と検索エンジン
- Courseraのオンラインコース:応用回帰分析
- ジョンズ・ホプキンス大学のオンラインコース:Mathematical Biostatistics Boot Camp 1
- 無料の電子書籍レビュー:データドリブン:データカルチャの作成
ビデオ、ポッドキャスト
- ディープラーニングの概要。 ビデオ講義のセット
- データの間違いトップ10
- Talking Machines:エピソード6:Geoffrey Hinton、Yoshua Bengio、およびYann LeCun:内側からの機械学習の未来は、Talking Machinesポッドキャストシリーズの第6エピソードです。この場合、Geoffrey Hinton(Google、トロント大学)、Yoshua Bengioとの会話の続きです(モントリオール大学)およびYann LeCun(Facebook、NYU)。
データ工学
- Airpal:SQL Webアプリケーション -Airpalは、情報を分析するときにFacebookのPrestoDBを補完するように設計されたWebベースのデータベースアプリケーションです。 そして、この投稿で彼はその機能と機能について語っています。
- MongoDbでの単一ビューの作成(パート1):概要とデータ分析
- Apache Sparkでのビッグデータ処理
- Docker Composeを使用したNeo4jでのApache Spark
レビュー
- Rの世界から興味深い(2015年3月9〜15日)
- KDnuggets.comの今週のベストコンテンツ(3月1〜7日)
- KDnuggets.comの今週のベストコンテンツ(3月8〜14日)
- DataScienceCentralウィークリーダイジェスト(3月16日)
- MyDataMine.comからのデータサイエンスニュース(3月15日)
- MyDataMine.comからのビッグデータニュース(3月12日)
- Data Elixirの今週のベストリソース(No. 26)
- R1Softからの最高の資料の毎週のコレクション(3月13日)
- 高スケーラビリティに関する最も興味深い資料(3月13日)
前号: データ分析と機械学習に関する最も興味深い資料の概要No. 38(2015年3月2〜8日)