データ分析と機械学習のトピックに関する最も興味深い資料のレビューの次号を紹介します。
全般
- 将来のビッグデータの専門家を訓練する方法
- データサイエンステンプレートの視覚化は、視覚的で興味深いインフォグラフィックです。
- RStudioの新機能(v0.99プレビュー):コード補完
- IPython:バージョン3.0がリリースされました
- パルサー:eBayリアルタイムデータ分析フレームワーク
- 高コストのないディープラーニング -HighScalability.comポータルの小さな記事で、大規模な金銭的投資なしでディープラーニングを使って実験を開始できることがわかります。
- 機械学習ライブラリ -周期表の形式で提示され、いくつかのカテゴリに分けられた機械学習ライブラリの大きなリスト:ビッグデータ、Lua / JS / Clojure、コンピュータービジョン、NLP、C / C ++、R /ジュリア、Java、Scala、Python
機械学習の理論とアルゴリズム、コード例
- ビッグデータ学習:Spark MLlib
- 異常なプレイボーイモデル、またはScikit-learnを使用したデータの異常値の検出について
- Google AIは49個の古いAtariゲームを独力でマスターしました
- 機械学習の使用を避けるための間違い
- Twitterデータ分析と機械学習によるユーザーの探索
- 機械学習エラー -この出版物の著者は、機械学習アルゴリズムを使用して問題を解決する人々が直面するいくつかの典型的なエラーについて説明しています。
- Google R Code Design Standards(GoogleのRスタイルガイド)
- クラスバランシングは分類子の結果を改善しますか?
- k-meansクラスタリングアルゴリズムのK予測アルゴリズムは、BigMLライブラリの興味深い機能です。
- ディープスピーチ:ディープラーニングとGPUによる正確な音声認識
- Rを使用したクラスターの可視化
- 学習アルゴリズムと教師の比較(教師あり学習)
- 機械学習と自然言語処理の一連のレッスン。 レッスン4:単純ベイズ分類器
機械学習コンテスト
オンラインコース、トレーニング資料、文献
- 新しいコースのお知らせ:データサイエンス入門 -コースが有料であることは注目に値します。
- 書評:Rで科学計算をマスターする
- 無料の電子書籍:Hadoop for Dummies
- 無料の電子書籍:ダミー用のソフトウェア定義ストレージ
ビデオ、ポッドキャスト
- サンフランシスコのディープラーニングサミットでのAndrew Ngのインタビュー
- RとH2Oライブラリを使用した機械学習のスケーリング
- Talking Machines:エピソード5:Geoffrey Hinton、Yoshua Bengio、Yann LeCun:The Inside Machine Learning Storyは、Talking Machinesポッドキャストシリーズの5番目のエピソードです。この場合、Geoffrey Hinton(Google、トロント大学)とのセッションです)、ヨシュアベンジオ(モントリオール大学)、ヤンレクン(Facebook、NYU)。
データ工学
- Apache Spark:内部には何がありますか?
- Apache Kafka、Cloudera Search、Hueを使用したリアルタイムログ分析
- ビッグデータストリーミング:Storm、Spark、Samza
- Apache Sparkでのビッグデータ処理
- MongoDbをHadoopとSparkで使用する:パート1-基本とカスタマイズ
- 新しい時代の始まり:Apache HBaseバージョン1.0リリース
- Hive-on-Sparkのベータ版をダウンロードできるようになりました
レビュー
- Rの世界から興味深い(2015年2月23日-2015年3月1日)
- KDnuggets.comの今週のベストコンテンツ(2月15〜21日)
- DataScienceCentralウィークリーダイジェスト(3月2日)
- MyDataMine.comからのデータサイエンスニュース(2月27日)
- MyDataMine.comからのビッグデータニュース(2月24日)
- Data Elixirの今週のベストリソース(No.24)
- R1Softからの最高の素材の毎週のコレクション(2月27日)
- 高スケーラビリティに関する最も興味深い資料(2月27日)
前号: データ分析と機械学習に関する最も興味深い資料の概要No. 36(2015年2月16〜22日)