オープンデータが犯罪の予測にどのように役立つか

こんにちは、Habr!



オープンデータは人類に何をもたらしますか? 今年、彼らはMinecraftでデンマークを再現するのを手伝いました。これは興味深い成果ですが、単純な素人にとってはあまり重要ではありません。 データを使用すると、特定のパラメーターで都市を比較したり、都市に関する人々の意見を見つけたり(地理位置情報を使用して同じツイートをアップロードしたり)、人々の動き(ナビゲーションサービスからのデータ)を学習した後、生活を改善するために使用できます(たとえば、交通量を減らすため)。



昨日、あるイベントで興味深い研究を聞きました。モスクワの自動車の動きを分析した後、このような分析のためのプラットフォームの開発チームは、この都市の新しい高速道路では渋滞の問題を解決できないことがわかりました。 人々は街中を絶対にランダムに移動するため、問題を解消するには「毛​​細血管」道路網を構築する必要があります。 一方、モスクワ地方では誰もが主要道路に沿って移動します。



これは、オープンデータを実際に使用するための1つの方法にすぎません。 また、これらのデータが何かを売るのにどのように役立つかについて長い間話すことができますが、私はもう少し人道的な問題-生活や安全などを改善する問題に興味があります。









最初に、セキュリティ、シェルター、食料、利便性、その他の利益を得るために、私たち全員が自由を犠牲にしていることを覚えておく必要があります。 そして今、私たちは個人の生活を犠牲にしています。なぜなら、私たちはそれぞれ「内部」にいるからです。誰もがスマートフォンを持ち、誰もがネットワークに座っており、健康データを収集するあらゆる種類の「スマート」な時計をすでに手に持っている人もいます。 何のために? 健康のために私の人生を改善するために。 ただし、このルールは、受信したデータを正しく使用できる場合にのみ機能します。



イタリアのトレント大学で、彼らは「Once Upon a Crime」と呼ばれる実験を実施しました。 ここで、調査の結果を含むページを見つけて、PDFでダウンロードできます。



彼らは何をしましたか?



研究者たちは、もちろん、匿名のオープンな人口統計データと、携帯電話からのデータをロンドンの実際の犯罪データと組み合わせました。



まず、人口統計データと犯罪データのみが使用されました。 したがって、アルゴリズムは、最も「悪い」ポイント、つまり来月犯罪が発生する可能性のある場所を約62%の確率で予測することができました。



次に、電話からのデータがこのデータに追加され、アルゴリズムが68%に改善されました。 わずか6%ですが、それでも重要です。



さらに重要なこと:電話から受信したデータの一部は、他のデータよりも重要であることが判明しました。 たとえば、電話ユーザーが自宅にいるか路上にいるかにかかわらず、犯罪を犯す可能性に大きく影響します。 たとえば、iPhoneはすでに人が家にいるのか職場にいるのかを理解できます。これにより、「先見者」の仕事が簡素化されます。



画像



これはなぜですか?



ロンドンのどこで犯罪が発生するかを正確に予測できるかどうかを理解する。 これらの違反を予測して、人的および技術的リソースを適切に配布することで防止できるようにします。



研究の問題は何ですか?



犯罪データ、統計は定期的に更新されません。 一方、携帯電話事業者は、所有者に関するすべてのデータ(つまり、年齢、性別など)とともに、電話の位置情報をリアルタイムで追跡できます。



結果はどの程度正確ですか?



イタリアの科学者は、アルゴリズムにより、ほぼ70%の時間で特定の地域(必要に応じて都市部)で犯罪を犯す可能性がどれほど高いかを特定できると考えています。



画像



それらの使用方法は?



「少数意見」に示されているレベルの予測はまだ非常に遠く、その「レベル」でさえエラーがありました。 絶対確実な赤字で犯罪者を連れ去るために、警察がいつ、どこに行かなければならないかを言うことはできません。



このアルゴリズムが提供するのは、状況を改善するために予算資金を導くために、最も危険なエリアと最も危険な時間を特定することです:たとえば、監視カメラを設置して、調査エリアをパトロールする警察官の数を増減します。



したがって、オープンデータと犯罪データを使用すると、犯罪との闘いの効果を高めることができます。



しかし、ここでも疑問が生じます。個人はこのために自分の人生を犠牲にする準備ができていますか?



All Articles