こちらの記事では、Looker Studio(旧称データポータル)のデータソースエディタの操作方法についてご紹介させていただきます!Looker Studioのデータソースエディタの基本的な内容を把握したい方におすすめで有料級だと思います!
どーも、さきやんです!ご覧いただきありがとうございます。
こちらの記事にたどり着いているということは「Looker Studio(旧称データポータル)」に興味・関心がある方だと思っています。
こちらの記事は以下のような人におススメだと思います!
- これからLooker Studioを始めたい方
- Looker Studioの「データソースエディタ」について知りたい方
それではどうぞご覧ください!
こちらの記事では、大きく3つのステップで説明させていただきます。
まず初めに、Looker Studioのレポート作成の流れの中で「データソースエディタ」がどこに位置付けられるのかについてご紹介させていただきます。
本記事の目的であるLooker Studioの「データソースエディタ」に関して解説させていただきます!
グラフを作る際に重要になる「ディメンション」と「指標」の調整方法について解説させていただきます!
本題を説明する前にさきやんの事前の準備・構築環境についてご紹介したいと思います。
Looker Studioの初期設定が終わっていない方は以下の記事を参考にしていただければ幸いです!
はじめに、Looker Studioのレポート作成の流れは以下の大きく5つのステップに分けられます。
今回の記事ではステップ❷が対象となります。
レポート化したいデータに接続し、必要に応じてデータソースエディタで利用しやすいデータに加工します。
接続されているデータからレポートに様々なグラフを追加します
キャンバスに対してテーマの選択やバナー追加を行います
作成したレポート(ダッシュボード)を表示、共有します
各ステップの概要については下記のページで整理していますのでご覧ください。
次から本題の内容を解説していきたいと思います!
それでは本記事の本題である「データソースエディタ」について説明させていただきます。
データソースエディタを使うことで、既存のデータソースを変更、設定することが可能です。
このデータソースエディタを利用することで以下のようなことが可能です。
- データソースの更新
- データの更新頻度の変更
- データの認証情報の変更
- フィールド(ディメンションと指標)の調整
詳細は次節以降で説明させていただきます。
この記事では、データ接続されていることが前提になりますので、データ接続について詳細を知りたい方は以下の記事をご覧いただければ幸いです。
まずデータソースエディタの起動方法について紹介します。
Looker Studioの上部のメニューから「リソース」を選択し、「追加済みのデータソースの管理」をクリックします。
データソースの一覧が表示されるため、対象のデータソースの「編集」を選択します。
以下のようにデータソースエディタを開くことが可能です。
簡単ですよね!
続いて、データソースエディタの機能について、以下の画像で概要を記載させていただきます。
この中で以下の3つの機能について、詳細な説明をさせていただきます。
❶ データの認証情報
❷ データの更新頻度
❸ コミュニティビジュアリゼーションのアクセス
❶ データの認証情報
はじめに「データの認証情報」についてです。
レポートを閲覧する際には前述のデータソースの種別に関わらず、レポートのデータを閲覧できるユーザーはデータの認証情報を利用して制御します。
データの認証情報に関するオプションは2種類あります。
オーナーの認証情報の特徴としては以下の通りです。
・ データソースのオーナーの認証情報を使い、データセットへのアクセスを承認する
・ このオプションの場合、基になるデータセットへのアクセス権を閲覧者に対して要求しない
こちらを利用する際の注意事項としては以下のことをレポートやデータソースを共有する前に確認しておくことが望ましいです。
共有先のユーザが信用できること
閲覧者の認証情報の特徴としては以下の通りです。
・ このオプションの場合、基になるデータセットへのアクセス権を閲覧者に対して設定する必要がある
例えば、AさんからBさんに共有しようとしているレポートの元データがGoogleスプレッドシートだったとします。
共有されたBさんは当然AさんのGoogleスプレッドシートへはアクセスできませんので、スプレッドシートの共有設定でAさんがBさんを追加する作業が必要になります。
❷ データの更新頻度
続いて「データの更新頻度」についてです。これはデータソースのデータの更新状態を指しています。
データソースの種類が異なれば、データの更新頻度に対する要件や期待値も異なり、データソースごとの更新頻度は以下の通りです。
データソース | 更新頻度 |
---|---|
BigQuery | 分単位: 1~50 分ごと、時間単位: 1~12 時間ごと |
Googleアナリティクス | 1 時間ごと、4 時間ごと、12 時間ごと |
Googleスプレッドシート | 15分ごと、1 時間ごと、4 時間ごと、12 時間ごと |
その他のコネクタ | 場合によって異なる |
例えば、Googleスプレッドシートの変更画面は以下のように表示されます。
基本的に更新頻度は高い方に設定したいと思いますが、ここでキャッシュという仕組みについてご説明させていただきます。
キャッシュとは、一時的なデータストレージシステムのことで、キャッシュからデータを取得する方が、元データから直接取得するよりも短時間で済むことからLooker Studioでは利用されています。
また、送信されるクエリの数を減らしてコストを最小限に抑えるのにも役立ちます。例えば、BigQueryのような利用に応じて課金されるようなデータセットを利用している場合、利用回数が多いとコストが増加する可能性がある、ということを示しています。
以上がデータの更新頻度に関する基本的な説明です!
❸ コミュニティビジュアリゼーションのアクセス
コミュニティビジュアリゼーションのアクセス(コミュニティにおける視覚化へのアクセス)とは、Looker Studioのデベロッパーによって作成されたグラフで、データを利用して、Looker Studioのデフォルトのグラフと同じように設定できるようにするための機能です。
こちらの機能はベータ版(2024年3月時点)として提供されており、グラフを提供するデベロッパーが信頼できるかどうかは確認することが望ましいとされています。
アクセス | 概要 |
---|---|
オン(デフォルト) | コミュニティのグラフを利用する場合 |
オフ | コミュニティのグラフを利用しない場合 |
コミュニティギャラリーでは次のようなグラフを利用することができるため、利用したいグラフがある場合はオンにする必要があります。
以上でデータソースエディタの基本的な説明は完了です!
実際にグラフ作成時に重要な「ディメンションの調整方法」について紹介させていただきます。
まずLooker Studioの画面で説明すると、以下の赤枠の部分に指標とディメンションがあります。
前述でデータ接続が完了後、グラフを作成する際には必ずこの指標とディメンションを利用します。
指標とディメンションを簡単に表現する際の説明としてよく使われるのが「●●別の××のデータを見る場合」という表現です。
例えば、日本の人口の元データがあったとして、そちらを分析する場合、「●●(都道府県)別の××(人口)のデータを見るために棒グラフを利用する」と考えると用語を区別しやすいかと思います。
ディメンションとは
ディメンションについてGoogleのヘルプページでは以下のように定義されています。
ディメンション – データをグループ化できる未集計の数値のセットです。以前と同様、データソース内のディメンションは緑色のフィールドとして表示されます。
出典(Looker Studioヘルプ)
ちょっとこれでは理解しにくいと思いますので、簡単に言うと「分類するための軸」になるデータで、以下の図のように棒グラフで表すと軸の部分がディメンションです。
広告関係のディメンションだと・・・
キャンペーン
広告グループ
オーディエンス
クリックタイプ
コンバージョンカテゴリ
デバイス
曜日
時間
検索語句
週
のようなものが挙げられます
指標とは
指標についてGoogleのヘルプページでは以下のように定義されています。
指標 – 値のセットに適用できる特定の集計です。指標自体には値のセットが定義されていないため、指標でグループ化することはできません。以前と同様、データソースの指標は青色のフィールドとして表示されます。
出典(Looker Studioヘルプ)
ちょっとこれでは理解しにくいと思いますので、簡単に言うと「数値で表現」可能なデータで、以下の図のように棒グラフで表すと棒の部分が指標です。
広告関係の指標だと・・・
広告表示回数
クリック数
コンバージョン数
クリック率
コンバージョン率
インタラクション率
エンゲージメント率
のようなものが挙げられます。
まずは簡単に用語や利用するデータを改めて説明させていただきました。
今回の説明時に利用するデータは以下のCSVファイルです。同じように操作されたい方は以下のファイルを使っていただければと思います。
こちらのデータはe-Stat(政府統計の総合窓口)から取得した「家計調査」に関するデータ(抜粋)です。取得方法やe-Statについては以下の記事で説明していますので、ご興味があればご覧ください。
【簡単】1分でわかる!いまさら聞けないe-Stat(政府統計の総合窓口)とLooker Studio連携について解説!ここまでが用語や利用データに関する補足説明でした。それでは次から本題の指標とディメンションの調整方法について説明します!
まず「グループ化」について説明させていただきます。
グループ化とは、ヒストグラムのように階級(ビン)別にグラフを表示したり、ディメンションの軸の分類を増やすために利用されます。
例えば、年単位で集計されたデータに対して、10年刻みで集計したいと考えた際にこのグループ化を行います。
グループ化を行う方法は、「フィールドを追加」ボタンを押下後に表示される以下の「計算フィールドを追加」か「グループを追加」の2種類提供されています。
今回は簡単な「グループ追加」についてご説明します。
「グループを追加」ボタンをクリックすると以下の画面が表示されます。
このページで以下の表に従い設定を行います。
変更ポイント | 手順概要 | 本記事の設定内容 |
---|---|---|
グループ化するフィールドを選択 | プルダウンメニューから、グループ化する既存のフィールドを選択 | 時間軸(年次) |
新しいフィールド名 | 新しいフィールド名を指定 | 時間軸(10年刻み) |
グループ名 | グループのラベルを指定 | ①~③の3つを設定 ①2000年代 ②2010年代 ③2020年代 |
追加または除外 | プルダウンメニューで 「含む」または「除外」を選択 | ①~③はすべて「含む」 |
条件 | プルダウンメニューから条件を選択 | ①~③はすべて「含む」 |
グループの値 | フィールドに条件の値を指定 | ①200 ②201 ③202 |
実際に設定した画面は以下の通りです。
少しグループの値の設定の仕方が対象のデータにより異なってくるかもしれませんが、グループ化したいデータの共通的な文字列や数値を指定することが望ましいです
設定後に右下の「保存」ボタンをクリックすれば作業は完了です。
追加されたデータを表に追加すると、以下のように年代別のグループで分類できていることがわかります。
このようにしてうまくグループ化したディメンションを追加することで、自分の可視化したいグラフを作っていくことができるようになります。
続いて計算フィールドを利用したグループ化の方法についてです。
例えば、計算フィールド内で以下のように「CASE」を利用することで同じことを実現することが可能です。
CASE
WHEN 時間軸(年次) IN ("2000年","2001年","2002年","2003年","2004年","2005年","2006年","2007年","2008年","2009年") THEN "2000年代"
WHEN 時間軸(年次) IN ("2010年","2011年","2012年","2013年","2014年","2015年","2016年","2017年","2018年","2019年") THEN "2010年代"
WHEN 時間軸(年次) IN ("2020年","2021年","2022年","2023年","2024年","2025年","2026年","2027年","2028年","2029年") THEN "2020年代"
ELSE "Other"
END
関数の細かい説明は割愛させていただきますmm
このように複数のパターンでグループ化を行うことが可能なため、ご自身に合った手法を選んで使ってみてください。
参考程度にCASEに関する説明はLooker Studioのヘルプページをご覧ください。
CASE 式は CASE キーワードで始まり、END キーワードで終わります。その間に、以下のようなセクションまたは「節」を指定します。
- WHEN: 評価の対象となる条件。1 つの CASE 式に複数の WHEN 節を含めることができます。
- THEN: WHEN 節の条件が true の場合に返される結果。CASE 式内の WHEN 節ごとに 1 つの THEN 節を指定する必要があります。
- ELSE: 省略可。WHEN 節のどの条件も true にならなかった場合、CASE は ELSE 節の値を返します。ELSE 節が指定されていない場合は、
NULL
を返します。CASE は、後に続く各 WHEN 節を評価し、条件が true になる最初の結果を返します。残りの WHEN 節と ELSE 結果は評価されません。すべての WHEN 条件が false または NULL である場合、CASE は ELSE 結果を返します。ELSE 節が指定されていない場合は NULL を返します。
出典(Looker Studioヘルプ)
文字列操作は、特定のフィールドの文字列に対して様々な変換、削除などの処理を行うことが可能です。
例えば、以下のように時間軸を文字列から数値に変換したいケースを想定してみます。
手段としては様々ありますが、今回は「LEFT_TEXT」を利用してみます。
この関数は、与えられた文字列の先頭から指定した字数分の文字列を取り出すことが可能なため、以下のような計算フィールドを作成します。
CAST(LEFT_TEXT(時間軸(年次),4) AS Number)
ここでポイントになるのが、「CAST」を利用することです。このCAST関数を利用すると、LEFT_TEXTで抽出した先頭の4文字の数字に対して、数値に変換する処理を実施することが可能です。
上記の計算フィールドが正常に登録されれば以下のようにタイプが数値としてフィールド追加されます。
実際のLooker Studioで比較した表は以下の通りです。
このように文字列操作を行うことでフィールドを変更・追加することが可能です。
その他にも様々な関数があるため、詳細は以下の関数リファレンスをご覧ください。
最後に、指標のタイプや集計方法について説明します。やりたいこととしては以下の通りとします。
データソースエディタ上で対象のディメンションの地域区分がテキストになっていることを確認します。
地域区分の横にある縦に並んだ3つの点を選択し、「個別件数」をクリックします。
そうすると指標に「個別件数 地域区分」が数値で追加されます。
こちらは実際に表で確認すると以下のようにカウントされています。
ディメンションの「地域区分」を削除すれば「個別件数 地域区分」は11になります
このようにディメンションだった個数をカウントすることで指標に変更することが可能です。
また、タイプやデフォルトの集計方法も簡単に変更することが可能です。
ある程度事前にこの作業を済ました上でレポート作成(グラフ作成)していくことが望ましいですが、実際はやりながらこのデータソースエディタ側で変更作業をするケースの方が多いかと思います。
以上がディメンションと指標の調整方法に関する説明です!
データソースエディタ自体はあまり面白い内容ではないと思いますが、レポート作成においてはとても重要ですので、是非活用してみていただければ幸いです!
お疲れさまでした!これでこちらの記事のゴールは達成です!
これでご覧の皆様もLooker Studioのデータソースエディタに関する基礎を把握している状態が整いました!
以上、本記事は終わりになりますので、ここまで読んでいただいた方は誠にありがとうございました!
Looker Studioに関する情報は以下のページでまとめておりますので、他にもLooker Studioの事例や基本的な情報が知りたい方は是非ご覧ください!