本「集団心のプログラミング」は、主に分類とクラスタリングのアルゴリズムに専念していますが、独自の検索エンジン、遺伝的アルゴリズム、遺伝的プログラミングの作成など、他のトピックに関する章もあります。 説明したアルゴリズムのほとんどすべては、APIを提供するさまざまなサイトでのユーザーの行動の分析を使用して、Web 2.0の精神で適用されます。 しかし、特に嬉しかったのは、すべての例がPythonで書かれていることです。
本で説明されているアルゴリズムは次のとおりです。
- 協調フィルタリング。 または、人間の言葉で言えば、他の同様のものに付けた評価に応じて、ある種の購入、サイト、または音楽を推奨するアルゴリズム。 そのようなアルゴリズムでは、オンラインストアでの購入の賦課やlast.fmでの音楽の選択が機能します。 この章の最後には、 del.icio.usサービスからのリンクを推奨する例があります。
- グループ化(クラスタリング)アルゴリズム。 作成された例では、ブログのRSSフィードを分析し、ブログに出てくる単語の頻度に応じて、ツリー形式でグループに自動的に分割しようとします。 同時に、Segaranは、トピックの観点での近接度に応じて、ヒープ上の飛行機にあるブログの名前を作成する方法について話します。
- 別の章では、検索エンジンの構築に専念します。スパイダーを作成し、最も重要なこととして、相互のページリンクを考慮に入れて、Google PageRankの類似物を作成するなど、リンクランキングアルゴリズムを検討します。 同じ章に、ニューラルネットワークを使用して最も関連性の高いリンクを発行する例があり、ユーザーが好きなリンクをクリックすると学習することも興味深いことです。
- 別の章では、最適化方法について説明します。 ここでは、原則として、特別なものは何もありません。ランダム検索、山からの降下、アニーリング、および遺伝的アルゴリズムのアルゴリズムについて簡単に説明します。 カヤックサイトAPIを使用して、かなり具体的なタスクのフライトを検索することは、webdwanolの例として役立ちます。 しかし、この章では、できるだけ多くの人々を満足させるために学生をホステルに移動し、接続を示す線が交差しないように人々の間の接続を描画するアルゴリズムに興味がありました。
- ソートアルゴリズムは、例としてスパムフィルタリングを使用して検討されます。 ベイジアンアルゴリズムが提示されます。これは通常、同様の問題を解決するときに最初に頭に浮かび、その修正はフィッシャー法です。 例は、 Akismet Webサイトでの作業です。
- 意思決定ツリーを構築するためのアルゴリズムについて説明します。章の最後には、 Zillow Webサイトから不動産価格データをダウンロードし、住宅のパラメーターが価格にどのように影響するかを示す意思決定ツリーを作成する例があります。指定されたパラメータを使用して自宅で。
- 1つの章は数値予測に当てられています。 ここでは、k個の最近傍のアルゴリズムとk個の最近傍の重み付きアルゴリズムを検討します。 この章の最後の例では、指定されたパラメーターに従って、eBayオークションで商品の最も可能性の高い価格を推測しようとします。
- サポートベクターマシンや核メソッドなどの分類アルゴリズムについては、別の章で説明します。 残念ながら、最も興味深いのは、サポートベクターメソッドがほとんど考慮されていないことです。 より正確に言うと、文字通り彼の指に書かれていますが、彼のやり方ではありませんが、この例では、このアルゴリズムが既にプログラムされているライブラリhttp://www.csie.ntu.edu.tw/~cjlin/libsvm/を使用しています。 この章の最後には、 FacebookサイトAPIを使用した一致ペアの例があります。
- 別の章では、データ配列によって独立した属性を識別することに専念していますが、ここでは、正直なところ、説明したアルゴリズムが何をするのか本当に理解していませんでした。
- そして最後の章は遺伝的プログラミングに焦点を当てています-太陽の下の場所(RAM内)をめぐってクラス間で競合する場合のさまざまな遺伝的アルゴリズムは、それらの間で交差および変異する異なるプログラムをシミュレートします
その結果、私はこの本が好きでした。そのようなトピックに自分で興味があるだけでなく、例はあなたの好きな言語で書かれています。 嬉しいことに、作者は試してみましたが、多くの例では、分析のために既製のデータを選択しており、作者のサイトからダウンロードできます。 ところで、彼は最近、 データ処理に関する書籍をさらに2冊出版しましたが、ロシア語でそれらを見るかどうかは大きな疑問です。
欠点のうち、説明したアルゴリズムのいくつかについてさらに詳しく読みたいと思うことがありますが、出発点として、この本は非常に適しています。