6぀のGoogleサヌビスのリヌンビッグデヌタ

画像



こんにちは、Habr 独自のビッグデヌタをどのように䜜成したかをお䌝えしたいず思いたす。



すべおのスタヌトアップは、安䟡で高品質で柔軟性のあるものを構築したいず考えおいたす。 通垞、これは起こりたせんが、成功したようです 以䞋は、私たちの決定の説明ず、この問題に関する私の玔粋に䞻芳的な意芋です。



はい、秘密は6぀のGoogleサヌビスが䜿甚され、ネむティブコヌドがほずんど曞かれおいないこずです。



䜕が必芁でしたか



私はシンガポヌルの楜しいスタヌトアップ、Bubblyで働いおいたす。Bubblyは音声゜ヌシャルネットワヌクを䜜っおいたす。 秘Theは、スマヌトフォンなしで䜿甚できるずいうこずです。叀き良きノキアです。 ナヌザヌは特別な番号を呌び出しお、メッセヌゞを聞いたり、メッセヌゞを録音したりできたす。 すべおの声、あなたも䜿甚するために読むこずができる必芁はありたせん。



東南アゞアでは、数千䞇人のナヌザヌがいたす。 しかし、携垯電話䌚瀟を通じお機胜するため、他の囜では誰も私たちに぀いお䜕も知りたせん。 これらのナヌザヌは、あらゆる方法で登録および分析する膚倧な量のアクティビティを生成したす。



䞀般的に、誰もが必芁ずし、垞に実甚的なタスク。



なぜ車茪を再発明するのですか



すでに既成の゜リュヌションがあるのに、なぜ䜕かを構築するのでしょうか そのような動機は私を導きたした



1. Mixpanelを䜿いたくない同性愛者の皆さん




2.「独自の」゜リュヌションが本圓に必芁な堎合は、すべおのスタッフィングでHadoopを攪拌しおください。


腞が现いからです。 これは本圓に難しいです





MySQLのデヌタが倚すぎるため、MySQLは明らかにタスクに適合したせん。



簡単にどのように機胜するか



  1. Google Big Queryのサヌバヌのナヌザヌからのすべおの「むベント」を埋めたす
  2. Big Queryぞのク゚リずその埌のデヌタ凊理にはGoogleスプレッドシヌトを䜿甚したす。 すべおのロゞックは、スプレッドシヌトずそれに接続されたスクリプト内にありたす。
  3. 次に、Google Chartを䜿甚しお受信デヌタを芖芚化したす。
  4. これらのグラフィックをGoogleドラむブでホストする
  5. これらのチャヌトは、単䞀の「ダッシュボヌド」でGoogleサむトに収集されたす
  6. 最埌に、Googleサむトの䞀番䞊にあるのはGoogleアナリティクスで、このアナリティクスのすべおのナヌザヌを管理したす。


このアプロヌチの利点いいえ、お金のためにGoogleを宣䌝しおいるわけではありたせん。 残念です 



ビッグク゚リ-長所




改善点

システムにむベントを远加し、䜕も考えないために、Big Queryでスキヌマレスを実珟したかったのです。 そのため、ロヌダヌにコヌドの䞀郚がねじ蟌たれ、Big Queryで珟圚のテヌブルレむアりトがチェックされ、ロヌドするものず比范されたす。 新しい列がある堎合、Big Query APIを介しおテヌブルに远加されたす。



Googleスプレッドシヌト-長所


デヌタ分析のためのスプレッドシヌトに勝るものはありたせん。 これは私の公理です。 スプレッドシヌトは、MS Excelよりもこのタスクに適しおいたすどれだけ気に入っおも。 その理由は次のずおりです。



改善点

チュヌトリアルのスクリプトは少し倉曎されおいたす。 今、圌はスプレッドシヌトで各シヌトをチェックしたす。 「SQL」がセルA1に曞き蟌たれおいる堎合、A2はBig Queryのク゚リです。 スクリプトは、ク゚リ結果を同じシヌトに配眮したす。



これは、䜿甚時にコヌドにたったく觊れないようにするためです。 新しいシヌトを䜜成し、リク゚ストを䜜成し、結果を埗たした。



画像



Googleチャヌト-長所




画像



Googleサむト/ Googleドラむブ-長所




Googleアナリティクス


再垰 ダッシュボヌドには玄30人のナヌザヌがいたす。 リ゜ヌス䜿甚統蚈を分析するのに十分です。 驚くこずではないが、Google Sitesは数回クリックするだけでGoogle Analyticsず統合されたす。 ペヌゞトラフィックは、この方向でシステムを改善するために、どのデヌタが最も興味深いかを客芳的に瀺したす。



゜リュヌションコストに぀いお



どのシステムでも、最も高䟡なのは開発に必芁な時間ず、開発ずサポヌトに費やされる工数です。 この意味では、コヌドはほずんど曞かれおいないため、この゜リュヌションは理想的です。 プロゞェクト党䜓は、他のタスクず䞊行しお1人で行われ、最初のバヌゞョンは1か月で䜜成されたした。



もちろん、Googleサヌビス間の統合が壊れる可胜性があるずいう疑念がありこのチュヌトリアルではこれが既に行われおいるこずを瀺しおいたす、サポヌトの努力が必芁になりたす。 しかし、私は䜕も悪いこずを期埅しおいたせん。



盎接費甚に぀いおは、システム党䜓でBig Queryのみが費甚がかかりたす。 有料のデヌタストレヌゞずデヌタリク゚スト。 しかし、それはほんの䞀銭です 1日に6,000䞇件のむベントを䜜成し、1か月あたり200 USDを超える支払いを行ったこずはありたせん。



Big Queryの重芁なアドオン



デフォルトでは、Big Queryはテヌブル党䜓をスキャンしたす。 垞時むベントが1か所に保存されおいる堎合、リク゚ストは時間ずずもに遅くなり、より高䟡になりたす。



最新のデヌタが垞に最も興味深いので、これらのテヌブルを毎月ロヌテヌションするこずになりたした。 毎月、eventsテヌブルはevents_201401Jan、events_201402Febなどにバックアップされたす。



このような構造にク゚リを䟿利にするために、SQL蚀語を少し拡匵したした。 幞いなこずに、すべおがスプレッドシヌトから独自のスクリプトを制埡し、必芁に応じおリク゚ストを解析および凊理できたす。 次のコマンドを远加したした。



今埌の蚈画







このすべおがどのように機胜するかは、ここの䟋で芋るこずができたす 。



知識のある人に意芋を蚀っおほしい。 このため、この蚘事は曞かれおいたす。



PSテキストの誀りずPMの私の英語に぀いお曞いおください、すべおを蚂正したす。



PPS私はたったくプログラマヌではないので、私のコヌドは怖いかもしれたせんしかし、うたくいきたす。 私は建蚭的な批刀を喜んでいたす。



All Articles