Uberデータの民主化

みなさんこんにちは!







ハロウィーンの下、私はブダペストでの会議( Data Crunch )に参加し、多くの興味深いプレゼンテーションを聞きました。 そのうちの1人はUberで、データ管理プラットフォームを編成したアプローチについて話しました。 このレポートは、経営や食料品ほど技術的なものではありませんでした。







Uberは、乗客やドライバーとのやり取りの結果として収集したデータを広範囲に使用します。 彼らは旅行の費用を計算し、人々の流れを評価し、価格アルゴリズムを変更し、ドライバーにもっとお金を稼ぐ方法を提案し、これはすべて収集されたデータに基づいています。 そのような会社では、データを扱うすべての作業をアナリストとDSのグループの手に集中させることはできません。 そうでなければ、彼らはあまりにも多くを雇わなければならず、さらに、彼らは常にビジネスの文脈に没頭しているわけではありません。







当初から、同社は、かなり高度な分析ツールを幅広いユーザーに使用できるデータ管理プラットフォームを構築する道を歩んでいました。 彼らは4つの主要なグループを特定しました:







  1. 通常のユーザー-基本的なSQLを知っており、基本的にはデータテーブル、ダッシュボードだけが必要です)
  2. 地域管理者-彼らはもう少しSQLを知っており、さまざまなセクションのデータを見て、スライスとサイコロが必要です。
  3. データアナリスト-高度なSQL、ダッシュボードの構築、調査の実施、データの洞察の検索
  4. データサイエンス-データの操作、モデルの構築、実験の実施、A / Bテストなどの最大レベルの理解

    副次的に、彼らはまた、実際には5番目のレベル、つまり主にトップレベルのレポートとダッシュボードを使用するトップマネージャーがあることを彼らから学びました。


興味深いことに、Uberでは、何らかの方法でデータを扱う人は少なくとも最低限のレベルでSQLを知っている必要があります。







プラットフォームに基づいて作成した製品の例として、A / Bテストの自動化を挙げました。 同社は膨大な量のA / Bを費やし、各データサイエンティストに割り当てます。そのため、彼は実験を組織し、テストの評価を行います。これも許容範囲ではありません。 したがって、彼らは一般のユーザーに、データサイエンティストをロードせずに、A / Bを正しくエラーなく解釈して使用する機会を提供したいと考えています。







この製品の構築は、データサイエンティストとの深い仕事から始まりました。 これらの人がすべてが正しいと見なされているかどうかわからない場合、データ製品は機能しません。 実際、彼らはA / Bテストの開始と評価を自動化し始め、Data Scientistに彼らの生活を楽にするツールを与えました。 その後、彼らはこのツール上にテスト結果を単純な形式で表示するインターフェースを作成しました(何が始まったのか、どのような違いがあり、違いが重要かどうか)。 同時に、A / Bテストに固有の最大数のニュアンスを「ボンネットの下」に隠したため、ユーザーは数学や統計を深く掘り下げる必要がありませんでした。







興味深いことに、私がコーヒーブレイクで話したほとんどの人は、A / Bテストを実践しておらず、意思決定の際に多くの定性的研究と直感を使用していると言いました。 だから、他の場所と同じように、一度考えたら、カットする必要があります!








All Articles