トレーニングコース「データの視覚化」

1月25日と26日に、研究所はデータの視覚化に関する実践的なトレーニングコースを実施します。







昨年、私たちの研究室では視覚化の問題を解決し、データを提示するための新しい形式を思いつきました。 定期的で活発なヒントを導き、講義を行い、モスクワ州立大学のモスクワ航空大学の学生とサンクトペテルブルクデザイントラックの参加者と実践的なクラスを実施しました。 共有にa敬の念を抱かない膨大な量の資料を収集し、複雑なデータを使用して「あなたに」行き、トピックに飛び込みたい人のための2日間の実践コースを準備しました。



コースでは、参加者は設計ツールを使用してデータを操作する方法を学びます。 初日は、良い例と悪い例を分析し、馴染みのある表、グラフ、チャートを再確認し、ボア収縮、パフパイ、モザイク、ドノグラムなどの異常な形式に慣れます。 2日目には、ラボのWeb技術者であるDima Tikhvinsky devgruが 、インタラクティブな視覚化のための最も現代的で柔軟なツールであるD3.jsライブラリを操作する際にこれらのスキルを適用する方法を示します。 すべてのコース参加者は、簡単な講義ノートを含む配布資料を受け取ります。





このコースは、デザイナー、アナリスト、マネージャー、プログラマー、ジャーナリスト、オンライン出版物の編集者に役立ちます。 D3.jsの予備知識は必要ありません; HTML、CSS、およびJavaScriptの経験は有用ですが、必須ではありません。



ハブロフスク市民の興味を引くために、私は便利で楽しい驚きを用意しました。 この記事では、有能な作業のレシピを複雑なデータで共有します。これらのデータはコースで教え、割引を受ける方法を説明します。





便利な驚き


この夏、私はコースデータサイエンスコースを受講しました。 とりわけ、「データの視覚化」というトピックがありましたが、それは明らかな理由で非常に興味がありました。 講義はセシリア・アラゴン教授によって行われました。 それらの1つの短い断片を与えます。



教授は当初、視覚化のタスクは特定のデータセットの視覚コーディングの最も効果的な方法を選択することであると述べ、これがどのように行われるかを伝えることを約束します。 私の意見では、定量的情報のカラーコーディングの禁止(こんにちは、Yandexの交通渋滞)を含むいくつかの曖昧な発言の後、セシリアは情報のエンコードに適したすべての視覚的属性を示しています。







次に、彼女は、演習として、自動車データを彼らの助けを借りて視覚化することを提案します。







講義の最後に、セシリアは生徒が提案した解決策を示します。







この視覚化をよく見てください。 彼女は何について話しているのですか? どのようなパターンが見えますか? どのようなメリットがありますか?



この例の視覚属性はすべて任意に選択されています。 軸は明らかなパターンを示しています-エンジン出力が大きいほど、燃料消費量が大きくなります。 データは下部の境界に積み上げられ、ゼロ以外の垂直基準点はスケールに違反します(最も「食いしん坊」の車は経済的な車とは10倍、実際は3倍異なります)。 「十字架」と「三角形」の重さはどれくらいですか? 左上隅の車のクラスターはどういう意味ですか? 視覚化は文字通り解読され、常に凡例を参照する必要がありますが、これでも興味深い結果は得られません。



これは私がこの問題を解決する方法です。



まず、データを調べて、解決できるタスクを理解する必要があります。 車に関するデータからどのような重要な結論が導き出されるか、そして自動車の現実の最も重要なパラメーターである価格を考慮せずにそれらを研究する必要がある理由を想像することはできません。 あなたはこれが不正であり、著者が初めてこのパラメータを持っていなかったと言います。 しかし、人生で遭遇するデータセットに最もよくあるのは、まさにこの問題です。それらは不完全です。 それどころか、私はシリンダーの数と重量を減らしましたが、他のパラメーターと比較して面白くないように思われました。



そのため、情報デザイナーNo. 1のタスクは、データとそれらを扱うシナリオを研究し、最も完全なセットを収集し、その中の重要な次元を強調することです。 私の例では、データ「Auto.ru」を使用しています。







情報デザイナーNo. 2のタスク:表示されるパラメーターの意味を考慮に入れた、視覚的コーディングの最も効果的な方法を選択する。



車の価格が他のパラメーターにどのように依存するかを知りたいので、Y軸では価格を延期します(学校では従属変数と呼ばれていました)。 年またはパワーは横軸で求められます-ほぼ均一な分布を持つ数値パラメーター。 生産年に対するコストの依存関係のグラフは興味深いかもしれませんが、力を選択し、そうでない場合は年が表示されます。 このステップでは、単純な2次元グラフを取得します。





年を明確に表示する方法は? 色で? サイズ? 透明性? 数字で署名するだけにしてみましょう:





特定の形式のため、年は明確に読み取られ、凡例と復号化は必要ありません。



あなたはおそらく、私が国を描写することをどのように提案するかをすでに推測していました。 もちろん、フラグを使って:





アジアのブランドの豊富さに注意してください。最古の(ドイツの)最も高価な(日本の)車はパワーの点で誰よりも先であり、韓国人の価格は50万以下であり、最新の車はスペイン語で、安いもの。 パラメータの自然な指定により、これらの機能はすべて単純に読み取られます。



それでは、燃料消費量を把握しましょう。 ピクトグラム、カラーコーディング、その他のグラフィック要素は視覚化に負担をかけます。 しかし、既存の測定値を使用するとどうなりますか? 結局、消費は、購入後に車の価格に追加される通常のコストに過ぎません。 ただし、リットルにルーブルを追加することはできないため、垂直軸に添加剤を表示するには、流量をルーブルに変換する必要があります。 たとえば、自動車の所有者が5万kmを走行するためにガソリンに費やす金額を計算します:50,000 / 100 *消費*ガソリン1リットルあたりのコスト。







そのため、自動車のコストだけでなく、その運転も確認します。 同様に、5万kmのメンテナンス費用を表示できます。画像はさらに完全になります。 この視覚化に基づいて、市場の動向を調査し、手頃な価格の車を選択できます。 ここで話を終わりますが、このグラフに車のモデルに関する情報を表示する方法について、読者自身で考えることをお勧めします。 コースの参加者は、クラスの初日に正解を見つけます:-)



楽しい驚き



コースには多くの費用がかかります(多くのコースを止められることは知っていますが)。 コースをよりアクセスしやすくするために、Habrユーザー向けの特別なプロモーションを考案しました。 記録するときにこのメモを参照する新しい参加者には、(N-1)千ルーブルの割引が適用されます。Nはハブロフスクの参加者の数です。 つまり、2人がhabraから来た場合、全員に1,000ルーブルの割引が適用され、11-の場合、それぞれの割引は10,000になります。 (コース料金は初期価格で支払う必要があります。コース当日に割引料金を支払った参加者数で計算し、お客様に都合の良い方法で返金します。グループの最大人数は16人です。



できるだけ多くの人にデータを友達にしたいです。 友人や同僚に、このコースが興味を持ちそうなプロモーションについて伝えてください。そうすれば、少しでも節約したい人を助けることができます。



詳細なプログラムとコースエントリ: http : //brainwashing.pro/dataviz




All Articles