Tableau Serverを使って、基本的なチャートを描こうと思います。
★関連記事
・VPS環境構築からTableau Server on Linux導入手順
・Tableau server運用手順〜外部DBサーバーの連携〜
・Tableau Hyper API使用例(CSVからHyperへ変換)
★参考
「Tableauによる最強・最速のデータ可視化テクニック ~データ加工からダッシュボード作成まで~」松島七衣著
チャートタイプについて
チャートには、
「棒グラフ」「折れ線グラフ」「積み上げ棒グラフ(帯グラフ)」「積み上げ面グラフ」「散布図」「ツリーマップ」「面グラフ」「ヒストグラム」「箱髭図」などいくつかの種類があります。
それぞれ、得手・不得手があります。自分が伝えたい目的に応じて、適切なグラフを使うことにより、説明力もぐっと高まります。
一般的に、
量の大小を表すときは棒グラフ、
増減を表すときは折れ線グラフ、
割合を表すときは円グラフや帯グラフが向いています。
以下のリンクを参考にしてください↓
【具体例付き】代表的なグラフの種類、使い方、ニッチなグラフからよく間違っている使用例をご紹介
今回は、代表的なチャートである、円グラフ、折れ線グラフ、散布図を
TabelauServerを使って描画しようと思います。
環境
Tableau Server のバージョン: 2020.2.4 (20202.20.0721.1350) 64ビット Linux
CentOS Linux release 7.8.2003 (Core)
データソースの準備
今回はTableauの公式サンプルを使いました
① サインインを行い、ホーム画面より「ワークブックの作成」をクリックします。
② 「ファイル」タブで、「ドロップしてアップロード」にデータソースのエクセルファイルをローカルからドロップします。
③ シートにある「Orders」をデータとして使います。「Orders」を中央にドラッグ&ドロップします。
④ 画面左下の「Sheet1」を選択します。
それではチャートを描いていきましょう
円グラフ
★完成イメージ
▼円グラフのポイント
・データの全体の割合を示すときに使います
・項目数は多くても5つに抑えましょう
・人間は扇型を比較するのは得意ではなく、比較が難しいので、
円グラフよりも100%帯グラフや棒グラフで表現する方が
良いこともあります
▼円グラフを描きましょう
① 「マーク」カードのドロップダウンリストから、マークタイプを「円グラフ」にします。
② 「データ」ペインから「Segment」を「マーク」カードの「色」に、「Sales」を「マーク」カードの「角度」にドロップします。
③ ツールバーにあるドロップダウンのリストを「ビュー全体」に変更します。(グラフが大きくなり見やすくなります)
④ 色を降順に並べ替えます。
「マーク」カードの「Segment」を右クリック>「並べ替え」をクリックします。
⑤ 開いた画面で上から「フィールド」、「降順」、「Sales」、「合計」とします。
×ボタンをクリックして画面を閉じます。
⑥売上の値ではなく、その割合で表すには、「角度」に入れた「合計(Sales)」を右クリック>「簡易表計算」>「合計に対する割合」を選択したら、完成です。
折れ線グラフ(年・月の推移)
★完成イメージ
▼折れ線グラフのポイント
・折れ線グラフは値の増減を表すのに長けていて、利用機会が多いです。
・時系列の変化を表現する場面で主に使います。
▼折れ線グラフを描きましょう
① 「データ」ペインから「Sales」を行に、「Order Date」を列にドロップします。
※日付型のフィールドは年別に集計され、自動で折れ線グラフになります。
※折れ線グラフではないグラフを折れ線グラフにするには、
「マーク」カードのドロップダウンリストからマークタイプを「線」にします。
② 「列」の「年(Order Date)」の左側にある「+」マークをクリックします。
すると、「年(Order Date)」の右側に「四半期(Order Date)」が追加されます。
③ 追加された「四半期(Order Date)」の左側にある「+」マークをクリックします。
「四半期(Order Date)」の右側に「月(Order Date)」が追加されます。
④ ここでは年と月で表したいので、「四半期(Order Date)」を右クリック>「削除」を選択します。
(列にあるのは「年(Order Date)」と「月(Order Date)」だけになりました)
★ここで「列」に入っている「Order Date」の状態を確認してみましょう。
「月(Order Date)」を右クリックしてコンテキストメニューを開くと、上側の「月」と「不連続」が選択されており、不連続日付レベルであることがわかります。
また、青色のピルは不連続を表します。ピルとは、シェルフにドロップしたフィールドのことです。
★コンテキストメニュー右側の例で示されている通り、不連続日付レベルは日付の一部分で切り分けています。
例えば、2019年1月5日の不連続日付レベルは、年は2019年、月は1、日は5となります。
この例では「列」に不連続日付レベルの年、月、が入っているため、年レベルで分けてから、さらに月レベルで分けた売り上げを合計し、その結果を線で結んでいます。
各年の間が線で別れているのは、年で分けてから月で分けているためです。
散布図
★完成イメージ
▼散布図グラフのポイント
・棒グラフや折れ線グラフは1つのメジャーの傾向を把握する時に使いますが、散布図は2つのメジャーの関係性を把握したり、外れ値を見つけたりするときに使います
・メジャーの値を組み合わせて見られるため、インサイトが得やすいチャートです。
・ここでは、売上と利益の関係を製品名ごとに表します。
▼散布図グラフを描きましょう
① 「データ」ペインから「Profit」を行に、「Sales」を列にドロップします。
ここで点が1つだけ表示されます。
この点は、データ全ての売り上げの合計と利益の合計を示しています。
② 「データ」ペインから「Product Name」をマークカードの「詳細」にドロップします。
製品ごとに点が分かれます。
散布図の完成です。
※ステータスバー(画面下部のグレーの部分の左側を参照すると、「○○個のマーク」と表示されており、○○種類の製品ごとにマークが分かれたことを確認できます)
※連続のフィールドが行や列に入ると軸になります。
そのため、連続のフィールドが行と列の両方に入った場合は、自動的に散布図になります。
★散布図は次のアクションに繋げやすいビジュアル表現です。
次の分析に活用したり、集団から離れた外れ値を分析対象から除外したり、利益が低い製品の販売を中止する意思決定に活かしたりすることができます。
以上です。最後まで見ていただきありがとうございました。
このブログは株式会社CoLabMixによる技術ブログです。
GCP、AWSなどでのインフラ構築・運用や、クローリング・分析・検索などを主体とした開発を行なっています。
Ruby on RailsやDjango、Pythonなどの開発依頼などお気軽にお声がけください。
開発パートナーを増やしたいという企業と積極的に繋がっていきたいです。