Web私立探偵1.0

エントリー







前回、テキスト内の人物を検索する方法について説明しました 。 このようなことは、毎日ニュースをフォローし、メディア内の特定の人物の存在を監視することを余儀なくされるアナリストにとって非常に有用であることが判明しました。 この人も地元で重要な場合、最大の問題は始まります、そして、インターネットで彼女についての多くの情報を見つけることができます。 しかし、すべて同じですが、それに関する情報は非常に分散しており、構造化されていません。 この人は誰とつながっていますか? 彼女は誰と最も頻繁に交流しますか? 人はどのトピックの文脈で最も頻繁にインターネットをサーフィンしますか?



この人は人間である必要はありません。 たとえば、シリーズ「X-Files」の名前を入力すると、誰がそれを演じるか、そこでの主人公は何か、映画の主な対象は何か(たとえばFBI;))などに関する情報を得ることができます。



アイデアを発展させるために、目的のオブジェクトのすべての接続をリアルタイムで監視できることは非常に素晴らしいと言えます。 そして何? 内部セキュリティ部門のスペシャリストが仕事に来て、競合者フォーラムの「個人的な」住所で病棟の1つが突然活発な仕事を始めたという通知を見るのは悪い考えではありません。

最後のパラグラフは、いわばロードマップですが、最初の2つはすでに現実と見なされ、少なくともある程度実装されています。



かなりの歴史



ちなみに、最初の安定版の前は、MadWin(I、II)と呼ばれていました。 そして今、安定したリリースに到達したばかりで、プロジェクトは新しい息を吹き込み、それに伴い新しいアイコンと名前が付けられました。 プロジェクト自体は商用ライセンスの下で配布されており、時間が経つにつれて有料に切り替わります。 実際、実装およびサポート(サードパーティソフトウェアへの統合)のサポートと支援は、メインおよび一般のお客様に対して既に支払われています。 しかし、今のところ、これは最初の安定版リリースであり、教育目的で無料でダウンロードして使用するために少なくとも1か月は無料で利用できます。



機能的



したがって、すでに実装されているものと、プログラムの機能は次のとおりです。



指定されたすべてのプログラム機能は、可能な情報源の1つに関連して実行できます。



残念ながら、複数のソースを指定する方法はありません。 また、サイト上のいくつかの異なるフォルダー、いくつかのファイル、およびいくつかの異なるページをプログラムに強制的に分析させることはできません。 しかし、他の多くの機能と同様に、バージョン1.1に登場します。



ソースを指定したら、結果を保存するアドレスをプログラムに示すだけで十分です。 HTMLレポート。 そしてそれだけです。 ただし、テキスト内のリンクが十分に混同されている場合は、アルゴリズムの結果を高速化するために、リンク分析の深さを小さくする必要がある場合があります。



結果



さて、私たちは読者に、慣れるためにアルゴリズムの例を提供します。 たとえば、サイト分析:kde.org。 以下は、結果レポートへのリンクです。



プロジェクトは、32ビットアーキテクチャ用のバイナリdebおよびrpmパッケージの形式で、最も基本的なプラットフォームのアセンブリで配布されます。 インストーラーを使用して32ビットWindowsで実行されるバージョンもあります。 プログラムの更新は、 ここまたはプロジェクトの公式ページでいつでも見つけることができます。 スクリーンショットの詳細な手順と作業の詳細な説明については、 こちらをご覧ください



次は?



プロジェクトに興味がある場合、将来のリリース1.1で見られる可能性のある短い革新を以下に示します。



しかし、上に挙げたものに加えて、最もおいしい革新は、KDEのファイルにラベルを自動的に割り当てる機能です。 プログラムは、各TXTまたはHTMLファイルを分析した後、入力でフォルダーアドレスを受信し、ファイル内の問題の人物を含むタグをファイルに自動的に割り当てます。 おそらく、この機能はWindows 7のユーザーが利用できますが、ほとんどの場合利用できません。



リンク



プロジェクトサイト

Opendesktop

著者ブログ

twitter



All Articles