0.イントロ
人々が多くのサービスとアプリケーションを立ち上げるのを見るのは素晴らしいことです。
次に、製品の状況を適切に評価し、決定を下し、「病院の平均気温」の誤差に陥らないようにするためのオプションの1つを提供します。 内部では、少しのデータ、病院のメタファー、および「スタートアップメトリック」があります。
![](https://habrastorage.org/files/55b/9cc/41c/55b9cc41c6314031bbf884e4a1362ae9.jpg)
これは世紀の鳥であり、今日の記事で役立ちます。
1.永遠の質問:「何をすべきか?」
そのため、新しいマス
パーティーの後、問題が始まったばかりであることが明らかになります。
それぞれが
大多数にとっての良い方法は、彼らの状況を数字で適切に評価し、その後、パフォーマンスを改善するためにマーケティングとビジョンに取り組み、最後に数字で彼らの行動の結果を評価することです。 このパスに沿って進みます。
2.患者を紹介します!
ここで私はすでに私の仕事から具体的な例を検討し続けたかったのですが、そこには多くのユーザーがいて、「何をすべきか」という問題がほぼ毎日発生しています。 しかし、数字と詳細を明らかにするとすぐに、上司は仕事の情報を開示するために、
したがって、すべてのメソッドを私の趣味の例として考えます-bamb.ninjaは、英語を学ぶ人のための無料のプロジェクトです( このことについて Gicktime に関する記事がありました )。 要するに、このサービスでは、英語の本を分析し、テキスト内の難しい単語を予測することができます。 その後、サービスは新しい本を収集し、複雑な単語の翻訳をテキストに直接挿入します。 出力は、テキストに合わせた個人用のバージョンです。
これが今日の患者です。 患者は数千人のユーザーを抱えており、次にサービスをどうするかは明確ではありません。 そして、それは単なる趣味です-あなたは自由にデータを照らし、好きなようにそれを議論することができます。
![](https://habrastorage.org/files/fd8/884/331/fd8884331f244135bb1af6f7d91ba6f4.png)
3.重要な指標
技術プロジェクトでは、すべてが明らかではありません。 すべてのプロジェクトは異なり、その指標も異なります。 多くの場合、人々は1日あたりの登録数、コンバージョン、成長率を最も重要な値として考えようとします。 しかし、これらのパラメーターは外部からの影響を受けやすい-私はたくさんの広告を買って、人々をポップアップさせ、たくさんのメトリックが跳ね上がった。 喜び? そうでもない。 新規ユーザーは、登録して、再びアクセスすることはできません。 しかし、これらのメトリックは、サービスの品質と視聴者の真のエンゲージメントについては何も言いません。
健全なプロジェクトは、問題を解決し、ユーザーを引き付け、人々にサービスを何度も何度も使用させることができる便利で必要なサービスです。
そのため、サービスでの人の意味のある活動について話すパラメーターを見つけるとよいでしょう。 抽象的保持(登録された総数の何人がサービスに戻ったか)ではなく、人によって行われた意味のあるアクションの数。 そしてまだ-これらの意味のあるアクションの間の時間。
データベースを掘り下げてみると、プロジェクトのこれらのパラメーターは次のとおりであるという結論に達しました。
- 各ユーザーが翻訳したテキストの数(多ければ多いほど良い)
- ユーザーがテキストと翻訳をダウンロードするために関数を呼び出す間の平均時間(時間単位)。 より多くの、より良い。 人が定期的に新しい本をダウンロードして読んで、英語を上達させ、頭の知識を詰め込んでくれるといいでしょう。 人がすぐに30冊の本を翻訳し、永遠に忘れてしまったのは悪いことです。
- 各ユーザーのサービス内のエラーの数。 少ないほど良い。
- 各ユーザーの複合語のリストを持つ操作の数。 より多くの、より良い。 本を読んだ後、単語のリストに取り組むことは、人が連れ去られ、読んだ本から新しい単語を学んだことを示唆します。
これらのパラメータはすべて、人々がサービスを使用するかどうか、技術的な問題がそれらを妨害するかどうか、問題を解決するかどうかをかなり正確に示します。 プロジェクトには、作成または消費されるコンテンツのユニット数、作成/消費間の時間、このコンテンツの人気、人がサービスを使用する際のシステムのエラーなどのパラメーターも必要です。
そして、もちろん、成長、コンバージョン、維持率を監視する必要があります。これらの数値も知る必要があります。
4.それについてどうすればよいですか?
これで、サービスの重要な重要な兆候がわかりました。これは、人々がどれだけうまくいっているかを示しています。 次に何をする?
「平均値を計算して、すべてのユーザーに対して最適化を試みてください」と叫ぶ人が既にいます。 もちろん、平均も測定基準ですが、実際の状況についてはほとんど言及していません。
そこにいる全員(死体安置所の死体を含む)の病院の体温を測定すると、間違った結論に達する可能性があります。 たとえば、急性感染症と発熱のある100人を病院に送ると、平均気温はわずか36.6になり、その後すぐに家に送り返すことができます(死者を含む)-すべての平均値によると、すべてがうまくいきました。
病院の場合、平均値を最適化する戦略が不合理であると私たち全員が理解している場合、ソフトウェア製品の場合、これは誰にも明らかではありません。 スタートアップは、驚くほどの平均を導き出し、このビジネスのために数百万ドルを獲得し、3〜4年で死ぬのが好きです。
平均的でない場合、何ですか?
5.クラスター
グループの平均的なプロパティが、このグループに属するすべてのユーザーのプロパティを適切に反映するように、ユーザーをグループ化する必要があります。 これはユーザークラスターと呼ばれます。 数千人ではなく、少数のクラスターのみを考慮する必要があります。クラスターの統計値は、各クラスターの動作を反映しています。
クラスターを構築しています。
- データベースからこれらの非常に重要なパラメーターのテーブルをCSVでポンプアウトしています。翻訳された本の数、リクエストを処理する際のエラーの数、サービスの使用間隔、単語リストでの操作の数です。
- Weka-データマイニング用の無料プログラム。 値のクラスタリングは、データをマイニングする1つの方法です。 ウェカはニュージーランドの鳥のまぶたにちなんで名付けられました。
- いくつかの簡単な操作を使用して、wekaはWekaのユーザーに関するデータをフィードし、clustererを使用してユーザー間のクラスターを見つけます。 私たちのタスクでは、パラメーターEM -I 100 -N -1 -M 1.
0E-6 -S 100を使用してクラスター化ツールを使用することは非常に可能です(Wekaのドキュメントに精通し、さまざまなアナライザー、クラスター、分類器が何をするかについて少し洞察することをお勧めします)。
数千のユーザーの代わりに、異なるプロパティを持つ3つのクラスターのみを取得しました。これは、動作が異なるすべてのユーザーが驚くほどうまく適合します。 しかし、過去数か月にわたってプロジェクトを数回根本的に変更したため、信頼性を高めるために、先月のデータのみを取得します。現在の状況をより正確に表示します。
![](https://habrastorage.org/files/c9c/306/05c/c9c30605c95d447b9142cef81f032538.png)
6.分析する
- クラスター#0-悪くない人がサービスにこだわっています。 彼らは平均8冊の本を翻訳しました。翻訳機能の呼び出しの平均間隔は36時間です。 平均的な影響は非常に低く、テキストからの難しい単語のリストを使用した25.5回の操作です。 サービスの失敗のほとんどはこれらの人々によるものでした-彼らは多くの異なるテキストを翻訳し、多くの失敗した状況を引き起こしました。 ユーザー総数の9%。
- クラスター#1-短時間立ち往生している人々。 彼らはサービスごとに平均3.2冊の本を翻訳しましたが、新しい英語の単語を扱う上での関与のより良いパラメータを持っています-27.2 これらのユーザーは通常、サービスに問題はありません-0。また、標準偏差が大きいメイン関数の呼び出しの65時間-合計数の19%。
- クラスタ#2-試してみたが、それ以上進まなかった人。 新しい単語では機能せず、翻訳する本はほとんどありません。 同時に、サービスへの呼び出し間の平均値は34時間です。 明らかな異常-人々が平均1回オンにした場合、通話間の平均時間はどこから来るのでしょうか? 全体の72%。
これら3つのクラスターを見ると、
- 最も忠実なユーザーでさえ、単語の学習には取り組みません。 たぶん複雑すぎますか? 実装が不十分ですか? または、これは不要な機能ですか? はい、「私はそれをそのように見ます」が、多分人々は異なって考えますか?
- 登録後に全員がサービスの使用を開始できるわけではありません。 複雑すぎる? 仕事の原理は明確ではありませんか? 怠azine?
- それぞれ3冊の本を読むユーザーは、7〜8冊の本を読むユーザーよりも新しい単語を学ぶ可能性が高くなります。 それはトレンドですか、それとも単なる変動ですか? ここにパターンはありますか? しかし、たくさんの本で言葉を学ぶのは難しくなりませんか? それらにあまりにも多くの情報を投げかけていますか?
- 最も忠実なユーザーを維持するには、技術的な問題を解決する必要があります。 これらの人々にはどんな問題がありますか? 彼らには共通の理由がありますか?
クラスター内の人の分布は、問題があることを示しています。 そして、私の頭の中を少し考えて、データベースの追加の統計を見れば、これらの問題の性質とそれらを解決する方法を理解できます。 私が平均値をとった場合-写真は非常に楽しいでしょう。 そして、視聴者を増やし、「ユーザーあたりの本の数」の測定基準を増やすことに焦点を当てます。この場合、これは直接的な方法です。
7.それについてどうするか?
それでは、プロジェクトについて話しましょう。
- プロジェクトの重要なバイタルサインを特定します。
- それらの統計をアンロードし、クラスターを見つけようとします。
- 結果を表示します。 あなたはそれらについて何が好きで、何が好きではなく、何が疑いを引き起こしますか?
- 統計で
何か を変更したい場合は、クラスター内の値に対するいくつかの 要因の影響を説明する仮説を立ててください。 これらの要因に影響を与えてみてください。 手順1に戻り、サイクルをもう一度実行します。
これに、ユーザーの成長、MAU / DAU、保持、収益、コンバージョンなどの一般的な統計情報を追加します。意思決定を行うための非常に便利な作業用コンパスが得られます。 これらの数値を使用すると、現実との接触を失うことなく、適切なマーケティングを構築し、先見の明のある決定をテストできます。
8.アウトロ
クラスターが病院内に構築された場合、彼らは建物内に異なるカテゴリーの患者がいることをすぐに認識します。 それらのいくつかは死体であり(これが起こります)、壊れた腕と脚を持つものもあり(石膏とX線が必要です)、いくつかはすでに回復して家に帰ることができます。
もちろん、これはすべての問題を解決するわけではありませんが、数十万人の患者の規模では、このフロアに感染部門があり、抗生物質を使用する必要があることを理解するのに役立ちます。 誰がどの病気にかかっているのか正確にはわかりませんが、抗生物質でこの領域をポンプでくむことで、より適切な結果を得ることができます。
統計分析のさまざまなアプローチを検索して試してください。 コホートを分析し、データをマイニングしてグループを選択してください。 アクティビティの平均値、ピーク、ディップからの偏差を探します。 一般的に-さまざまな角度から統計を見てみてください。 主なことは、スタートアップの標準的な指標を超えて、より広く物事を見ることです。
フォースがあなたとあなたの行為と共にありますように!