膝RFM分析(Excel)

こんにちは 2014年の夏、通常のアナリストとして働き、先延ばしに非常に苦しんでいた彼は、オンライン衣料品店の設立に参加しました。 このプロジェクトの管理会計システムを正常に「ウォッシュダウン」し後、彼は所有者の目に、分析全般の神、特にExcelのハローを見つけました)それ以来、愚かな人ではない所有者は、ひどく怠zyではありますが、すべてを解決するために私を引き付けました多かれ少なかれ分析に近いタスク。 これらのタスクの1つの結果を共有したいと思います。 カットの下で、私のRFM分析実装オプション。 かなりの研究予算を持っていない小規模なB2Cビジネスの所有者や、ビジネスでのExcelの実用化に関心のあるすべての人にとって興味深いものになります。





Oftop:HabréにはRFMタグが2つしかなく、両方の企業ブログがあります。 Habréにはeコマース関連分野の人がたくさんいるので、なぜこのテーマにほとんどコンテンツがないのかが不思議です。



しかし、私は水を注ぐことをやめて、条件について同意することをまず始めに提案します。 さらに、RFM分析とは、会社の顧客価値の分析を意味します。 実際、 ABC分析のわずかに高度なバージョンであり、製品ではなく顧客に焦点を当てています。 焦点は、ビジネスに対する各クライアントの利益の大きさを形式化することにあります。 この利点を特定するために、各クライアントは次のパラメーターに従って考慮されます。



効率- ノベルティ (最後の購入からの時間)

頻度 - 頻度 (期間ごとの購入の頻度)

一元化- 収益化 (期間の購入コスト)



与えられた



1. .xlsxアップロード形式のオンラインストアの販売履歴。

画像



シック! 数字の意味を探してはいけません、すべてが1-2の順序で半ランダムに変更されます



2.所有者からのTK。その完全版は、「RFM分析を実行できますか?」というフレーズほど複雑ではないように聞こえます。



結果



最初は、「ピボットテーブルの計算されたオブジェクトを使用してこれをすべて実行して、美しくする方法」を考えて半日を過ごしました。 その結果、私は美点を獲得し、中間シートと「= IF」などの通常の式を使用して1時間で作成しました。



3.中間計算



最後の購入からの時間を計算するには、現在の日付(Excelの標準関数= DATE())とクライアントの最後の購入の日付が必要です。 アンロードは「Date-Client-purchase_amount」の順序付けられていない配列であったため、各顧客の最終購入日を特定することは困難でした。 アップロードの日付範囲全体をソートすることで問題を解決しました(「集団農場スタイル」のせいではないようお願いしますが、すぐに解決策を頭の中に実装したかったので、その時点で美点をつけました)。 初期情報の列は緑色でマークされています。 最初の行では、理解のために数式を残し、降順で列で並べ替えました(列は連結を使用して作成されました)





4.「概要」シートのコンポーネント



次に、RFM分析の結果を1つのシートに収集します。 クライアントのリストから開始します(ソートは関係ありません)-最初のシートからクライアントのリストをコピーし、標準機能(データ-重複の削除)を使用して一意のレコードのみを残します。 VLOOKUPを使用して列Bに、最後の顧客注文の日付を引き出​​します。 列Cの式は、アップロード全体の販売注文数をカウントします。 列Dも同様に、顧客の注文量を考慮します。 また、列Eは、お客様が最後に購入してからの日数を計算します。



シック! 列Eの式の例がセルK1に示され、結果を示すために値のみが列Eに保存されます



5.期限(最後の購入からの時間)



選択された式の本質は次のとおりです:0から最大値(赤の式で強調表示)までの5つの等しい間隔のどれが列Eの各セルの値を含むかを調べ、1(1年前に私たちから何かを購入したクライアント)から5(それを購入したクライアント)まで評価しますまたは最近)。





6.頻度(期間の購入頻度)および金銭(期間の購入費用)。



式は同じなので、頻度の例を見てみましょう。 この場合、母集団全体を集計間隔のメンバーの数に等しい3に分割し、列Cの値が1(他から購入する頻度が低い顧客)、3、5(他から購入する頻度が高い顧客)のどの間隔に適用されるかを調べます)





ウィキペディアで中央値の定義を理解するのが難しい、または怠findだと思う人のために:中央値は、データのセットを2つの等しい部分に分割する値です。 例:1、2、2、2、100回の購入を行った5人の顧客の算術平均値= 21.4(何も伝えていない病院の平均気温); 同じシリーズの中央値= 2。



結論 :すべてのインジケーターを一緒に追加し、「概要」シートの右端の列の降順でソートすることについては書いていません-私はそれが理解できると思います))私の目標-「膝の上に」システムを作成することは完全に達成されました 「そのまま」を差し上げます。 これらの行を追加して、中央値と例の定義も簡単ではないことを理解しています(大学で数学的統計を持っていなかった人にとって)。 誰かがよりシンプルで理解しやすいオプションを提供する場合-私はそれを交換します。



All Articles