ビッグデヌタずは、パヌト2







この䞀連の蚘事の最初の郚分では、デヌタず、そのようなデヌタの倧きなブロックから意味を抜出するためにコンピュヌタヌを䜿甚する方法に぀いお孊びたした。 90幎代半ばにAmazon.comのビッグデヌタに䌌たものを芋たこずがありたした。同瀟が䜕千もの顧客が同時にWebサむトで行ったすべおをリアルタむムで監芖および蚘録するためのテクノロゞヌを発衚したずきです。 かなり印象的ですが、䞀気にビッグデヌタず呌ぶこずができ、ふくらんでいるデヌタがより適しおいたす。 米囜囜家安党保障局NSAや英囜政府通信センタヌGCHQのような組織は、スパむ掻動の䞀環ずしお、その時点ですでにビッグデヌタを収集し、デゞタルメッセヌゞを蚘録しおいたしたが、それらを解読しお意味を芋぀ける簡単な方法はありたせんでした。 政府の蚘録ラむブラリは、䞀貫性のないデヌタセットで混雑しおいたした。







Amazon.comの方が簡単でした。 䜕䞇もの補品ず数癟䞇の消費者すべおを察象ずしおいたずしおも、顧客満足床は容易に刀断できたす。 顧客が実店舗たたは仮想店舗で実行できるアクションはそれほど倚くありたせん。 クラむアントは、入手可胜なものを確認し、远加情報を芁求し、補品を比范し、バスケットに䜕かを入れ、賌入たたは離脱できたす。 これはすべお、リレヌショナルデヌタベヌスの機胜内にあり、すべおのタむプのアクション間の関係を事前に蚭定できたす。 そしお、それらは事前に蚭定する必芁がありたすが、これはリレヌショナルデヌタベヌスの問題です。これらはそれほど簡単には拡匵できたせん。







そのようなデヌタベヌスの構造を事前に知るこず-胎児の朜圚的なすべおの友人のリストを䜜成する方法...人生のために。 リストが完成するずすぐに、新しい圹職を远加するには深刻な倖科的介入が必芁になるため、すべおの胎児のリストを䜜成する必芁がありたす。







デヌタの関係ずパタヌンの怜玢には、より柔軟なテクノロゞヌが必芁です。







90幎代のむンタヌネットの最初の䞻芁な技術的課題は、非構造化デヌタを扱うこずです。 簡単に蚀えば-日垞的に私たちを取り巻くデヌタであり、以前はデヌタベヌスの圢で保存できるものずは考えられおいたせんでした。 2番目のタスクは、デヌタ量が倚く、情報出力が少ないため、そのようなデヌタの非垞に安䟡な凊理です。







少なくずも1぀のアルカむダの蚀及を怜出するために100䞇件の電話での䌚話を聞く必芁がある堎合は、かなりの予算たたはこのすべおのデヌタを凊理するための新しい非垞に安䟡な方法が必芁になりたす。







圓時の商甚むンタヌネットには、World Wide Webであらゆる皮類のものを怜玢するこずず、䜕かを芋぀ける機䌚を埗るために広告を支払うこずの2぀の非垞によく䌌たタスクがありたした。







怜玢タスク。 1998幎たでに、Webサむトの総数は3,000䞇に達したした今日では20億を超えおいたす。 3,000䞇のサむト 。各サむトには倚くのWebペヌゞが含たれおいたす。 たずえば、Pbs.orgは30,000ペヌゞを超えるサむトです。 各ペヌゞには、数癟たたは数千の単語、画像、情報ブロックが含たれおいたす。 Web䞊で䜕かを芋぀けるには、むンタヌネット党䜓のむンデックスを䜜成する必芁がありたした。 これはすでにビッグデヌタです







むンデックスを䜜成するには、最初にWeb党䜓、1998幎には3,000䞇ホスト、珟圚は20億ホストをすべお読む必芁がありたした。 これは、いわゆるスパむダヌたたは怜玢ロボットの助けを借りお行われたした。これは、新しいWebペヌゞをむンタヌネットで系統的に怜玢し、それらを読んでから、コンテンツをコピヌしおむンデックスにドラッグしお戻すコンピュヌタヌプログラムです。 すべおの怜玢゚ンゞンは怜玢ロボットを䜿甚しおおり、継続的に動䜜する必芁がありたす。むンデックスを曎新し、新しいWebペヌゞの倖芳、倉曎たたは消倱に合わせお最新の状態に保ちたす。 ほずんどの怜玢゚ンゞンは、珟圚のWebのむンデックスだけでなく、原則ずしおすべおの叀いバヌゞョンのむンデックスをサポヌトしおいるため、以前の倉曎を怜玢するずきに、過去にさかのがるこずができたす。







むンデックス䜜成ずは、すべおのメタデヌタデヌタに関するデヌタ、単語、画像、リンク、およびペヌゞに埋め蟌たれたビデオやオヌディオなどの他の皮類のデヌタを蚘録するこずを意味したす。 次に、これに5億を掛けたす。 これは、むンデックスが衚すサヌバヌの玄1をむンデックスが占有するためです。これは、1998幎の3000䞇ペヌゞのデヌタの30䞇ペヌゞに盞圓したす。 ただし、むンデックス䜜成は情報の怜玢ではなく、メタデヌタの蚘録にすぎたせん。 むンデックスから有甚な情報を芋぀けるこずはさらに困難です。







むンタヌネットの最初の10幎間には数十の怜玢゚ンゞンがありたしたが、4぀が最も重芁であり、それぞれにこれらすべおのペヌゞから意味を埗るための独自の技術的アプロヌチがありたした。 Alta Vistaは最初の真の怜玢゚ンゞンでした。 圌女は、パロアルトにあるDigital Equipment Corporationのラボに登堎したした。 Digital Equipment Corporationは、実際にはXEROX PARCのコンピュヌタヌラボであり、ほが完党に2マむルをボブテむラヌによっお茞送したした。ボブテむラヌは䞡方を構築し、ほずんどの叀い埓業員を雇いたした。







Alta Vistaは、蚀語ツヌルを䜿甚しおWebむンデックスを怜玢したした。 そしお、圌女はドキュメント内のすべおの単語、たずえばWebペヌゞにむンデックスを付けたした。 「金のダブロンを怜玢する」ず尋ねるず、Alta Vistaは「search」、「gold」、および「doubloons」ずいう単語を含むドキュメントのむンデックスをスキャンし、芁求された単語ぞの参照数で゜ヌトされたペヌゞのリストを衚瀺したした。







しかし、それでもむンタヌネット䞊にはたくさんのたわごずがありたした。぀たり、Alta Vistaはこのたわごずをすべおむンデックス化し、良いものず悪いものを区別する方法を知りたせんでした。 結局のずころ、これらは単なる蚀葉でした。 圓然のこずながら、悪いドキュメントはしばしば2階に䞊がり、システムは隠された単語を挿入しお怜玢をゆがめるこずで簡単に膚らたせたした。 Alta Vistaは、実際の単語ず隠された単語を区別できたせんでした。







Alta Vistaの利点は匷力なDECコンピュヌタヌの䜿甚でしたがDECはコンピュヌタヌ機噚の䞻芁メヌカヌだったため、これは重芁なポむントでした、Yahooの利点は 人々の䜿甚でした。 同瀟は埓業員を雇い、文字通り終日りェブを閲芧し、手動でむンデックスを䜜成しあたり慎重にではなく、各トピックで最も興味深いものをマヌクしたした。 1,000人のむンデクサヌがあり、誰もが1日あたり100ペヌゞのむンデックスを䜜成できる堎合、Yahooは1日あたり100,000ペヌゞ、たたは幎間玄3,000䞇ペヌゞをむンデックス化できたす。これは1998幎のむンタヌネットナニバヌス党䜓です。銀河間芏暡に成長し、ダフヌの察象ずなりたした。 ダフヌの初期のシステムは、その人的資源ずずもに、拡匵したせんでした。







たもなくExciteが登堎したしたが、それは蚀語的なトリックに基づいおいたした。 トリックは、システムがその人が曞いたものではなく、本圓に必芁なものを探しおいたずいうこずです。誰もが正確にリク゚ストを䜜成できるわけではないからです。 繰り返しになりたすが、このタスクはコンピュヌティング機胜が䞍足しおいる状況で圢成されたしたこれが䞻芁なポむントです。







ExciteはAlta Vistaず同じむンデックスを䜿甚したしたが、「gold」たたは「doubloon」ずいう単語の䜿甚頻床をカりントする代わりに、6人のExcite埓業員が、各ク゚リがク゚リ条件ずその頻床。 ベクトルは、開始点、方向、および長さを持぀空間内の単なる矢印です。 Exciteの䞖界では、出発点は怜玢語がたったくないこずでした「怜玢」、「ゎヌルド」、「ダブロン」はれロ。 怜玢ベクトル自䜓は、これら3぀の怜玢条件を䜿甚しおれロかられロたでのポむントから始たり、たずえば2぀のナニット「怜玢」に拡匵されたした。たぶん5぀はダブロンです。 これは、むンデックスをむンデックス付けする新しい方法であり、保存されたデヌタを蚘述する最良の方法でした。なぜなら、怜玢された単語を盎接䜿甚しない結果になるこずが時々あったからです-Alta Vistaではできたせんでした。







Excite Web Indexは単なる単語ずその䜿甚頻床のリストではなく、怜玢が方向ずしお芋られる倚次元ベクトル空間でした。 各怜玢はデヌタハリネズミの1぀のずげであり、゚キサむトグラハムスペンサヌの倩才の刺激的な戊略は、1぀ではなく、近隣のすべおのずげをキャプチャするこずでした。 ク゚リの芁件を完党に満たしたドキュメントAlta Vistaなどだけでなく、倚次元ベクトル空間で定匏化された条件に類䌌するすべおのドキュメントを察象ずするExciteは、より䟿利な怜玢ツヌルでした。 圌はむンデックスに取り組み、凊理にベクトルの数孊を䜿甚したした。さらに重芁なこずは、むンデックス䜜成プロセスで蚈算がすでに行われおいたため、結果を埗るために蚈算をほずんど必芁ずしたせんでした。 Exciteは、原始的なハヌドりェアを䜿甚しおより良い、より速い結果を出したした。







しかし、Googleはさらに優れおいたした。







Googleは、怜玢に2぀の改善を加えたした-PageRankず安䟡なハヌドりェア。







Exciteの高床なベクタヌアプロヌチは、目的の怜玢結果を芋぀けるのに圹立ちたしたが、その結果でさえ圹に立たないこずがよくありたした。 Googleのラリヌペむゞは、信頌に基づくアむデアを䜿甚しおナヌティリティを枬定する方法を考案したした。 最初のGoogle怜玢では、Alta Vistaず同様の蚀語的手法を䜿甚しおいたしたが、远加のPageRankフィルタヌラリヌペむゞにちなんで名前を付けたしたが、気づきたしたかを远加したした。これは、最初の結果にアクセスし、関連付けられたペヌゞ数で構築したした。 このアむデアは、ペヌゞの䜜成者がこのペヌゞぞのリンクを提䟛するこずに煩わされるほど、ペヌゞがより有甚であるたたは少なくずも面癜くおも、悪い意味でさえこずでした。 そしお圌らは正しかった。 他のアプロヌチは消滅し始め、GoogleはPageRank特蚱で急速にトレンドになりたした。







しかし、Googleが別の方法で実装した別の詳现がありたした。 Alta VistaはDigital Equipmentから登堎し、DECの巚倧なVAXミニコンピュヌタヌクラスタヌに取り組みたした。 ExciteはSun Microsystems UNIXハヌドりェアを䜿甚したしたが、これは圌らの胜力に劣りたせん。 たた、Googleは、個人甚゜フトりェアよりも少し匷力なコンピュヌタヌ䞊で、フリヌ゜フトりェア、オヌプン゜ヌスの助けを借りおのみ発売されたした。 䞀般に、自家補のGoogleコンピュヌタヌにはケヌスも電源もない文字通り、自動車のバッテリヌから絊電され、自動車の充電噚から充電されるため、PCよりも小型でした。 最初の改造は壁にボルトで固定され、埌に産業甚オヌブンで焌きたおのペストリヌが入った倩板のようなラックを詰めたした。







Amazonは、ビッグデヌタのビゞネスケヌスを䜜成し、ハヌドりェアず゜フトりェアに実装するための䞍噚甚な方法を開発したしたが、ただビッグデヌタには適応しおいたせん。 怜玢䌚瀟は、むンデックス䜜成をマスタヌしながら、実甚的なデヌタセットのサむズを倧幅に拡倧したした。 しかし、実際のビッグデヌタはむンデックスを䜿甚しお機胜するこずはできず、実際のデヌタが必芁であり、これにはAmazonなどの非垞に倧きく高䟡なコンピュヌタヌ、たたはGoogleで巚倧なコンピュヌタヌのように芋える安䟡なPCを䜿甚する方法が必芁でした。







ドットコムバブル。 いわゆるドットコムバブルの時代の1990幎代埌半のむンタヌネットの倚幞感ず幌皚さを想像しおみたしょう。 ビル・ゲむツを始めずしお、誰にずっおも、パヌ゜ナルコンピュヌタヌ、そしおおそらくビゞネスの未来はむンタヌネットであるこずは明らかでした。 したがっお、ベンチャヌキャピタリストはオンラむンスタヌトアップに数十億ドルを投資しおおり、これらの䌁業が実際に利益を䞊げる方法に぀いおはあたり考えおいたせん。







むンタヌネットは巚倧な領域ず芋なされおいたした。そこでは、利益があるかどうかに関係なく、できるだけ倧芏暡な䌁業をできるだけ早く䜜成し、ビゞネスのシェアを奪い取っお保持するこずが重芁でした。 歎史䞊初めお、䌁業はその存続期間党䜓にわたっお利益を埗るこずなく株匏垂堎に参入し始めたした。 しかし、これは暙準ずしお認識されおいたした-プロセスで利益が珟れたす。







このすべおの䞍合理な豊かさの結果は、アむデアの埩掻であり、そのほずんどは他の時には実珟されなかったでしょう。 たずえば、Broadcast.comは、ダむダルアップを介しお倧勢の芖聎者にテレビを攟送するために考案されたした。 アむデアはうたくいきたせんでしたが、Yahoo ただ1999幎に57億ドルでそれを買いたした、そしおそれはマヌク・クバンを圌が今日残っおいる億䞇長者にしたした。







シリコンバレヌはムヌアの法則に埓っお建蚭されたため、コンピュヌタヌは垞に安䟡で匷力でしたが、ドットコム時代はこの法則を䜿甚するふりをしおいたした。 実際、 誇倧宣䌝に基づいお構築されたした。







誇倧広告ずムヌアの法則。 90幎代のこれらのむンタヌネット詐欺の倚くが成功できるように、ムヌアの法則によれば、デヌタ凊理のコストは実際に可胜なコストを倧幅に䞋回っおいたはずです。 これは、ほずんどのDotcomスタヌトアップのビゞネスモデルは広告に基づいおおり、広告䞻が支払う意思のある金額には厳しい制限があったためです。







しばらくの間、それは重芁ではありたせんでした。なぜならベンチャヌキャピタリストずりォヌルストリヌトの投資家は違いを補う甚意ができおいたからですが、結局、巚倧なデヌタセンタヌを備えたAlta Vistaは怜玢からのみ利益を埗られないこずが明らかになりたした。 Excite、および他の圓時の怜玢゚ンゞンず同様。







2001幎のドットコムは、スタヌトアップがスヌパヌボりルでの広告キャンペヌンを支揎するだたされやすい投資家からの資金を䜿い果たしたために厩壊したした。 最埌の愚か者の最埌のドルがハヌマンミラヌからの最埌のオフィスチェアに費やされたずき、ほずんどすべおの投資家はすでに圌らの株を売っお、去っおいたした。 数千の䌁業が倒産し、その䞀郚は䞀晩で厩壊したした。 アマゟン、グヌグル、および他のいく぀かは、オンラむンでお金を皌ぐ方法を理解するこずで生き残った。







Amazon.comは、Jeff Bezosのビゞネスがeコマヌスであったずいう点で異なっおいたした。 そしお、これは新しいタむプの貿易であり、レンガを電子に眮き換えるこずになっおいた。 アマゟンにずっお、䌚瀟の利益は取匕あたりのドルで枬定されるため、䞍動産ず絊䞎の節玄が倧きな圹割を果たしたした。 たた、ビッグデヌタず実際のむンタヌネットツヌルの最初の䜿甚である怜玢゚ンゞンの堎合、広告垂堎は1トランザクションあたり1セント未満で枈みたした。 これを行う唯䞀の方法は、ムヌアの法則を砎り、デヌタ凊理のコストをさらに削枛するず同時に、怜玢゚ンゞンを広告ずリンクさせお売り䞊げを増やす方法を理解するこずでした。 Googleは䞡方を行いたした。







ビッグデヌタの2回目のすばらしい到来の時が来たした。これは、今日のGoogleが4,790億ドルの費甚がかかる理由を完党に説明しおおり、残りの怜玢䌚瀟のほずんどは長い間死んでいたす。













GFS、Map Reduce、およびBigTable。 PageずBrinは、独自の超安䟡なサヌバヌを䜜成するこずが䌚瀟の存続の鍵であるこずを最初に理解したため、Googleは新しいデヌタ凊理むンフラストラクチャを構築しお、数千台の安䟡なPCを1台のスヌパヌコンピュヌタヌのように動䜜させる必芁がありたした。







ムヌアの法則がある時点で機胜し、利益を生むこずを期埅しお他の䌁業が損倱に慣れたように芋えたずき、Googleは90幎代埌半に怜玢゚ンゞンを収益化する方法を芋぀けたした。 これには、新しい機械、゜フトりェア、広告技術の発明が含たれおいたした。 これらの分野でのGoogleの掻動は、私たちをそのビッグデヌタの䞖界に盎接導きたした。そのビッグデヌタの圢成は今日芳察するこずができたす。







たず、今日のGoogleの芏暡を芋おみたしょう。 怜玢゚ンゞンで䜕かを怜玢する堎合、最初に䞖界䞭の数癟のデヌタセンタヌにある300䞇のWebサヌバヌずやり取りしたす。 これらのサヌバヌはすべお、1日あたり平均120億ペヌゞのペヌゞ画像をコンピュヌタヌ画面に送信したす。 Webむンデックスはさらに200䞇台のサヌバヌに保存され、さらに300䞇台のサヌバヌにはシステムに統合された実際のドキュメントが含たれおいたす。 合わせお-YouTubeを陀く800䞇台のサヌバヌ。







Googleのペニヌアヌキテクチャの3぀の䞻芁なコンポヌネントはファむルシステムたたはGFSであり、これらの数癟䞇台のサヌバヌすべおが通垞のメモリず考えるものにアクセスできたす。 もちろん、これは単なるメモリではなく、フラグメントず呌ばれる粉砕されたコピヌではなく、共通性のあるチップ党䜓です。 ファむルを倉曎する堎合は、数千キロメヌトル離れおいるサヌバヌであっおも、すべおのサヌバヌで同時に倉曎する必芁がありたす。







Googleにずっお倧きな問題は光の速床であるこずがわかりたした。







MapReduceは、倧きなタスクを数癟たたは数千のサヌバヌに分散したす。 圌はタスクを耇数のサヌバヌに䞎え、それらの回答の倚くを1぀に集めたす。







BigTableは、すべおのデヌタを含むGoogleデヌタベヌスです。 リレヌショナルはそのような芏暡では機胜しないため、リレヌショナルではありたせん。 これは、GFSず同様に䞀貫性が必芁な、昔ながらのフラットデヌタベヌスです。







これらの技術が開発される前は、コンピュヌタヌは人間ずしお機胜し、䞀床に限られた情報量で単䞀のタスクに取り組んでいたした。 膚倧な量のデヌタに察しお数千台のコンピュヌタヌを連携させる機胜は、匷力なブレヌクスルヌになりたした。







しかし、Googleは財務目暙を達成するのに十分ではありたせんでした。







ビッグブラザヌは広告䞻ずしおスタヌトしたした。 Googleは、デヌタ凊理を安くしおAmazon.comの利益率に近づけるのに十分でした。 オンラむン広告を販売するより収益性の高い方法を芋぀けた堎合、取匕ごずのセントずドルの残りの差はカバヌできたす。 Googleは、これたでむンタヌネットで行っおいたように、効果的なナヌザヌむンデックス䜜成を通じおこれを行いたした。







Googleは行動を調査し、消費者のニヌズを予枬しお、10から100倍の確率でクリックする広告を提䟛したした。これにより、Googleの収益はクリックの10から100倍になりそうです。







最埌に、ビッグデヌタに぀いお説明したす。







Googleのツヌルが内郚の䞖界ず倖郚の䞖界のどちらで機胜するかは重芁ではありたせんが、すべおが同じように機胜したした。 たた、たずえば、SABERシステムずは異なり、これらは汎甚ツヌルであり、ほがすべおの皮類のデヌタに適甚されるほがすべおの皮類のタスクに䜿甚できたす。







GFSずMapReduceは、デヌタベヌスのサむズや怜玢のスケヌラビリティに制限を蚭けた最初のものではありたせん。 必芁だったのは、平均的な鉄よりも倚かったため、埐々に数癟䞇台の安䟡なサヌバヌがタスクを共有するこずになりたした。 Googleは絶えずネットワヌクにサヌバヌを远加しおいたすが、デヌタセンタヌが完党に切断されない限り、故障埌にサヌバヌは亀換されないため、これは賢明に行われたす。 これは耇雑すぎたす。 それらは単にラック内に攟眮され、MapReduceはデヌタ凊理に埓事し、アむドル状態のサヌバヌを回避し、既存のサヌバヌを䜿甚したす。







Googleは2003幎にGFS、2004幎にMapReduceの蚘事を公開したした。このビゞネスの魔法の瞬間の1぀です。圌らはメ゜ッドを秘密にしようずさえしたせんでした。







Yahoo、Facebookなどは、Hadoopず呌ばれるオヌプンバヌゞョンのMap Reduceをすぐに再珟したした象のおもちゃの埌-象は䜕も忘れないでください。 これにより、珟圚クラりドコンピュヌティングず呌ばれるものが登堎したした。 これは単なる有料サヌビスです。数十たたは数癟台のレンタルコンピュヌタヌ堎合によっおは数秒間レンタルされるにタスクを分散し、耇数の回答を1぀の論理的に接続された゜リュヌションに結合したす。







ビッグデヌタにより、クラりドコンピュヌティングが必芁になりたした。 珟圚、これらの2぀の抂念を区別するこずは困難です。







ビッグデヌタだけでなく、゜ヌシャルネットワヌクもMapReduceずHadoopのおかげで可胜になりたした。10億人のFacebookナヌザヌが独自の動的なWebペヌゞを無料で䜜成し、䌁業が広告からのみお金を皌ぐこずができたからです。







AmazonでさえHadoopに切り替えたしたが、今日ではネットワヌクの成長に実質的に制限はありたせん。







Amazon、Facebook、Google、およびNSAは、MapReduceたたはHadoopがなければ今日は機胜したせん。ちなみに、これらはむンデックスの必芁性を氞遠に砎壊したした。 今日の怜玢は、むンデックスではなく、生デヌタによっお実行されたす。生デヌタは、刻々ず倉化したす。 より正確には、むンデックスは毎分曎新されたす。 ポむントではありたせん。







これらのツヌルを䜿甚しお、Amazonや他の䌁業はクラりドコンピュヌティングサヌビスを提䟛しおいたす。 クレゞットカヌドのみで歊装しおいるスマヌトプログラマは、数分以内に1台、1000台、たたは1䞇台のコンピュヌタヌのパワヌを䜿甚しお、問題を解決するこずができたす。 そのため、むンタヌネットスタヌトアップはサヌバヌを賌入しなくなりたした。 ロシア党土よりも倚くのコンピュヌティングリ゜ヌスを簡単に取埗したい堎合は、支払いに必芁なのはカヌドのみです。







ロシアがロシアよりも倚くのコンピュヌティングリ゜ヌスを取埗したい堎合は、プラスチックカヌドも䜿甚できたす。







倧きな疑問は未解決です。なぜGoogleはその秘密を競合他瀟ず共有し、研究を公開したのですか この愚かな慢さは、圓時スタンフォヌド倧孊で博士論文を擁護しおいたグヌグルの創始者偎にありたしたか いや Googleはその秘密を共有しお業界を䜜り䞊げたした。 圌は競合他瀟の目に独占のように芋える必芁はありたせんでした。 しかし、もっず重芁なこずは、他の䜕千もの花を咲かせるこずで、Googleは収益を30〜40増やしおむンタヌネット業界を埌抌ししたした。







圌の秘密を共有するこずで、Googleは倧きなパむの小さなピヌスを手に入れたした。







だから、簡単に蚀えば、ビッグデヌタが生たれたした。 Googleは、マりスのすべおのクリック、および他の人からの10億以䞊のクリックを远跡したす。 同様に、FacebookやAmazonのサむトにいるずき、たたは他のサむトでAmazon Webサヌビスを䜿甚しおいるずき。 たた、むンタヌネット党䜓のデヌタ凊理の3分の1をカバヌしおいたす。







これが瀟䌚にずっおどれほど重芁かをちょっず考えおみおください。 過去に䌁業がマヌケティング調査を䜿甚しお補品を消費者に販売する方法を考えおいた堎合、ビッグデヌタを䜿甚しおあなたの欲求ずそれをあなたに販売する方法を知るこずができたす。 だから、私は長い間むンタヌネットで高䟡な゚スプレッ゜マシンに関する広告を芋おきたした。 そしお、私が最終的にそれを買ったずき、システムは私の賌入を知ったので、広告はほずんど即座に停止したした。 圌女は私にコヌヒヌ豆ず、なんらかの理由で倧人のおむ぀を売ろうずしたした。







むかしむかし、Googleはすべおのむンタヌネットナヌザヌのためのサヌバヌを持っおいたす。 圌らず他の䌁業は、私たちに関するより倚くの皮類のデヌタを収集し、私たちの行動をよりよく予枬したす。 これが䜕をもたらすかは、誰がこのデヌタを䜿甚するかによっお異なりたす。 これは、私たちを理想的な消費者にしたり、テロリストを捕たえたりする可胜性がありたすたたはより成功したテロリスト-これは別の議論です。







乗り越えられないほど倧きなタスクはありたせん。







そしお初めお、Googleのおかげで、NSAずGCHQに保存されたむンテリゞェンスデヌタの怜玢ツヌルが぀いに登堎し、悪意のある人物をすべお芋぀けるこずができたす。 たたは、私たちを氞遠に奎隷にしおください。







 ナタリアベヌスによる翻蚳








All Articles