Tableau Softwareが視覚化のための自然言語インターフェイスを導入

こんにちは、Habr! Peter Sayer による記事「Tableauが視覚化を作成するための自然言語インターフェイスについて語る」の翻訳を紹介します



BIプロバイダーは、AI(人工知能)機能をBIツールに組み込むという成長傾向の一環として、データ分析を簡素化および自動化しようとしています。



画像



新しいデータモデルを作成するには、何人の統計学者が必要ですか? Tableau Softwareによると、まったくそうではありません。 同社は、広く使用されている分析ツールの次のバージョンがそれを行うと主張しています。



Tableauは先週、Ask Dataと呼ばれる新機能でデモを行いました。これにより、ユーザーは自然言語で必要なものを記述することで視覚化を作成できます。 これは、ニューオーリンズの顧客イベントで行われました。 さらに、同社はデータ準備ツールで新しい自動化機能を実証しました。



これは、かつて専門的なスキルが必要だったタスクを自動化および簡素化するエンタープライズソフトウェア開発者の成長傾向の一部です。



BIのAIテクノロジーの夜明け



人工知能の分野での成果により、企業のソフトウェア開発者は、特定のコマンドを学習したり、画面上のオブジェクトを操作して目標を達成したりする代わりに、自然言語(口頭または印刷)でデータを入力し、ユーザーが必要とする情報を表示しやすくなります。 AIは、分析とデータサイエンスを「民主化」することを期待して、主要なBIツールでますます使用されています。



TableauのライバルであるMicrosoft Power BIは、数年前に「質問と回答」と呼ばれる機能を導入しましたが、最近のデモでも、Tableau Ask Dataよりも文章の文法とスペルが複雑に見えます。 ただし、どちらもDundas BIなどに先んじており、ドラッグアンドドロップを使用して視覚化を作成しています。



Tableauの実装により、ユーザーはデータベースにクエリを実行し、ソフトウェアがデータベーステーブルの結合方法、選択する列、および目的の応答を得るために実行する必要のある操作を個別に決定できるようになります。 この機能やその他の新機能は、来年初めにリリースされる予定のTableau 2019.1に登場し、ベータ版は10月下旬にリリースされます。



このような自動化機能は歓迎され、必要です」とForresterのチーフアナリスト、マーサベネットは述べています。 「 私たちはますます多くのデータを取得していますが、それらを扱う人々はそれほど多くの時間を持っていません 。」



彼女によると、データスペシャリストはデータの準備に最大80%の時間を費やし、データに費やす時間が少ないほど、ビジネスに直接利益をもたらすBI機能を実行できるようになります。



専門家の時間不足を克服する1つの方法は、ほとんどのワークロードをマシンに転送することです。 もう1つの方法は、以前は特別なスキルを必要とするために自分で作業できなかった人々のデータの作業を簡素化することです。 これは、データのいわゆる「民主化」です。



AIを使用することの欠点



しかし、より多くの従業員にデータを提供することにはリスクがあります。データは、対象分野の専門知識や状況の冷静な評価に取って代わることはできません 」とマーサ・ベネットは述べました。



新しい自動化機能を広く利用可能にする前に、CIOは自分の経験でそれらをテストして、適切かどうかを判断する必要があります



明確な推奨事項なしでデータ分析を提供するツールは、ユーザーが実行するアクションと混同する可能性があります。



誰かに詳細な指示を与えない場合、最初にすべてを正しく行うことを期待しないでください 。」

-Forresterチーフアナリスト、マルタベネット



ただし、ソフトウェアを非難することはできません。



自動化は制御と同じではありません。 これらすべてのことは引き続き守らなければなりません。 コンピュータ自体がこれを行ったと言うと、法廷ではあまり良く聞こえないでしょう。そして、理由はわかりません 」とマーサ・ベネットは警告します。 この問題は、AIブラックボックスの問題として長い間知られています。



さらに、データが自動化ツールに適しているかどうかを調べる必要があります。特に、機械学習システムが機能するには大量のデータが必要です。



通常よりも例外が多いデータに機械学習アルゴリズムを適用すると、機能しません 」と彼女は言いました。



デモの詳細



ニューオーリンズのイベントで、ビジュアル分析マネージャーのAndrew Vignoは、KickstarterクラウドファンディングプロジェクトデータベースでAsk Dataの機能をデモし、ほとんどのコンパイラとは異なり、Ask Dataが完全な句読点を必要としないことを示しました。



ソフトウェアは彼のクエリを「資金調達総額」(文字通り)を「資金調達額」に変換し、応答を返しました。 「年別」および「ステータス別」を印刷した際、Ask Dataはリクエストを「期間別およびステータス別の融資額」に変換しました。 その後、追加のデータがないため、成功するプロジェクトの資金が毎年増加し、失敗、キャンセル、または一時停止されたプロジェクト(赤、オレンジ、黄色)の資金が変わらないことを示す色の折れ線グラフを作成しました。



「どのカテゴリが成功したか」という質問は、異なる視覚的な答えを引き起こしました:前のクエリに「カテゴリ、フィルタステータス-成功」にデータを追加し、成功したプロジェクトの数で降順​​でKickstarterカテゴリのランキングのヒストグラムを描きました。



従業員は、タスクを明確にすることができなくても、エンタープライズソフトウェアが望んでいることを長く望んでいたため、Andrew VignoはTableauがこれに近づいていることを示しました。 Ask Dataは、「平均的な資金と比較する」(逐語的)と入力すると、以前にレビューしたテクノロジープロジェクトのさまざまなサブカテゴリの平均的な資金の横にあるプロジェクト数の変動を示しました。



特にゆっくり入力する場合、Tableauの一部の操作はマウスを使用した場合でも高速です。散布図に「mod」と「game」のサブカテゴリを追加するのに4回クリックするだけです。



新しいデータモデルの作成



数回クリックするだけで、同僚のTyler Doyleは、SQLクエリでデータを分析するためにTableauで使用されるフィールドを表示し、基礎となるデータベースが理解できる新しいデータモデルを作成する必要がありました。



1行をクリックするだけで十分です。「関連オブジェクトを追加します」」と、使用するテーブル、接続方法、または左結合または右結合を決定する必要なく、データモデルの準備が整います。 Tableauの新しいデータモデリング機能は、あなたのためにそれを行います。

-タイラー・ドイル



データモデルは、これらのテーブル間の正しい関係をどのように知りましたか? 」-ドイルの不思議。 Tableauは、CIOとそのデータベース管理者およびデータ専門家に依存していることがわかりました。 彼がこのトリックを実行できるようにするには、必要な情報がデータウェアハウスに保存されていることを確認する必要があります。



データの準備は、Tableauが取り組んでいるもう1つの分野です。 シニアエンジニアのZahira Valaniは、Tableau Prepがロールを使用してデータクレンジングを自動化する方法を示しました。 Tableauはそれらを使用して、URL、メールアドレス、地理的表示(州または郵便番号)などの役割を果たすフィールドを識別します。 Valaniは、わずか数回のクリックで、Tableau Prepがフィールドの内容をチェックして最適なロールを決定し、ロールに一致しない無効な要素を選択し、それらを「null」に設定するか、これらの行をフィルタリングする方法を示しました。 列挙型などのカスタムロールでも同じことができます。



Tableauの最高製品責任者であるFrançoisEienstatによると、Tableau Prepは、メインのTableauソフトウェアの年間3つのリリースのスケジュールとは対照的に、毎月更新されます。



計画は、現在会社でベータテスト中の別のツールであるTableau Prep Conductorの機能です。 企業は、選択したスケジュールに従ってデータソースをTableauに移動することで、データソースの準備を自動化できます。 これはTableauとは別の製品であり、使用するには別のライセンスが必要です。 販売の開始は来年に予定されています。



All Articles