こちらの記事では、Looker Studio(旧称データポータル)のデータ接続方法についてご紹介させていただきます!Looker Studioのデータ接続の基本的な用語や内容を把握したい方におすすめです!
どーも、さきやんです!ご覧いただきありがとうございます。
こちらの記事にたどり着いているということは「Looker Studio(旧称データポータル)」に興味・関心がある方だと思っています。
こちらの記事は以下のような人におススメだと思います!
- これからLooker Studioを始めたい方
- Looker Studioの「データ接続方法」について知りたい方
それではどうぞご覧ください!
こちらの記事では、大きく3つのステップで説明させていただきます。
まず初めに、Looker Studioのレポート作成の流れの中で「データ接続」がどこに位置付けられるのかについてご紹介させていただきます。
本記事の目的であるLooker Studioの「データ接続」に関して解説させていただきます!
データ接続後、グラフを作る際に重要になる「指標」と「ディメンション」について解説させていただきます!
本題を説明する前にさきやんの事前の準備・構築環境についてご紹介したいと思います。
Looker Studioの初期設定が終わっていない方は以下の記事を参考にしていただければ幸いです!
はじめに、Looker Studioのレポート作成の流れは以下の大きく5つのステップに分けられます。
今回の記事ではステップ❷が対象となります。
レポート化したいデータに接続し、必要に応じてデータソースエディタで利用しやすいデータに加工します。
接続されているデータからレポートに様々なグラフを追加します
キャンバスに対してテーマの選択やバナー追加を行います
作成したレポート(ダッシュボード)を表示、共有します
各ステップの概要については下記の記事で整理していますのでご覧ください。
【初心者向けLookerStudio講座】Looker Studioの始め方次から本題の内容を解説していきたいと思います!
それでは本記事の本題である「データ接続の基本」について説明させていただきます。
基本的にLooker Studioではデータを持っていませんので、データを取得する必要があります。
その作業が「データ接続」です。簡単ですが、データ接続の際の全体感のイメージ図は以下の通りです。
Looker Studioでデータ接続する際には大きく3つのコンポーネント(部品)や機能が関係しています。
❶ コネクタ
❷ データソース
❸ 認証情報
それぞれ解説していきたいと思います!
Looker Studioと元データを接続するコンポーネント(部品)のこと「コネクタ」と定義されています。
参考までにGoogleのヘルプページには以下のような記載があります。
コネクタは、元になるデータに Looker Studio を接続します。データに接続すると、Looker Studio にデータソースが作成されます。
出典(Looker Studioヘルプ)
このコネクタは「Googleの提供するコネクタ」と「サードパーティーコネクタ」の大きく2つに分類されます。
Googleの提供するコネクタは記事の投稿時点で24種類あり、すべて無料です。24種は以下の通りです。
こちらの中でよく利用されそうなコネクタはGoogle側で簡単なヘルプページが提供されていますので、参考までに掲載させていただきます。
コネクタ名 | Googleヘルプページへのリンク |
---|---|
Google BigQuery | Google BigQuery に接続する |
Looker | Looker に接続する |
データベース プラットフォーム | データベース プラットフォームに接続する |
Google スプレッドシート | Google スプレッドシートに接続する |
Google サービス | Google サービスに接続する |
ファイルのアップロード | ファイルのアップロード |
Connect to Appsheet | Connect to Appsheet (opens in the Appsheet Help Center) |
利用頻度の高そうなコネクタについては、個別の解説記事を書いてみようかと思います!
サードパーティーコネクタはコミュニティコネクタとも呼ばれ、記事の投稿時点で896種類あり、すべて無料ではなく、一部有料なコネクタもあります。サードパーティーコネクタの一部は以下の通りです。
このコミュニティコネクタはインターネット経由でアクセス可能なあらゆるデータに接続できるように、Googleが提供しているコミュニティプログラムを利用して世界中で開発されています。
このプログラムは、Looker Studioユーザーが世界中の一般公開データセットやオープンデータセットに無料で簡単にアクセスできる環境づくりを目指す、オープンソースのプロジェクトです。
ご自身の気になるデータがあればコネクタがコミュニティで提供されているか検索してみるといいかと思います!
続いて、データソースについてご説明します!
コネクタで元データに接続するとLooker Studioにデータソースが作成されます。これはコネクタの特定のインスタンスを表しており、接続インスタンスの作成に利用されたコネクタによりフィールドとオプション設定が可能です。
このデータソースには「埋め込みデータソース」か「再利用可能なデータソース」の2種類がありますので、簡単に説明させていただきます。
埋め込みデータソースを利用すると、レポートのコピー、共有、共同編集が簡単に可能です。
再利用可能なデータソースを利用すると、様々なレポートで再利用でき、企業や組織全体で一貫したデータモデルを作成して共有が可能です。
それぞれの特徴を比較すると以下の表の通りです。
埋め込みデータソース | 再利用可能なデータソース | |
---|---|---|
共有・共同編集 | ||
接続変更 | ||
データの管理 |
特に組織内でのルールや拘りがなければ、「埋め込みデータソース」を使うと効率的かと思います!
「再利用可能なデータソース」がネガティブな表になっているようにも見えますが、企業や組織内で利用する際にはこの制限によってガバナンスを確保できるというメリットもありますので、その点ご承知おきくださいmm
データソースの特徴として、1つのレポート(ダッシュボード)で複数のデータソースに接続することが可能です。
その特徴を指名したのがレポートAのところで、1つのレポート上でスプレッドシートのデータソースから棒グラフを追加、BigQueryのデータソースから折れ線グラフを追加、というように様々なデータソースを1つのレポートに集約が可能です。
当然レポートBのように単独で利用することも可能です!
最後に「データの認証情報」に関してご紹介させていただきます。
レポートを閲覧する際には前述のデータソースの種別に関わらず、レポートのデータを閲覧できるユーザーはデータの認証情報を利用して制御します。
データの認証情報に関するオプションは3種類あります。
オーナーの認証情報の特徴としては以下の通りです。
・ データソースのオーナーの認証情報を使い、データセットへのアクセスを承認する
・ このオプションの場合、基になるデータセットへのアクセス権を閲覧者に対して要求しない
こちらを利用する際の注意事項としては以下のことをレポートやデータソースを共有する前に確認しておくことが望ましいです。
共有先のユーザが信用できること
閲覧者の認証情報の特徴としては以下の通りです。
・ このオプションの場合、基になるデータセットへのアクセス権を閲覧者に対して設定する必要がある
例えば、AさんからBさんに共有しようとしているレポートの元データがGoogleスプレッドシートだったとします。
共有されたBさんは当然AさんのGoogleスプレッドシートへはアクセスできませんので、スプレッドシートの共有設定でAさんがBさんを追加する作業が必要になります。
サービスアカウントの認証情報の特徴としては以下の通りです。
・ このオプションの場合、人間ではないユーザーを表す特別なタイプのGoogleアカウントを使用し、データにアクセスして認証を受けることが可能
不特定多数にレポートは配布する場合は基本的にはオーナーの認証情報を使うことが多いかと思います
以上がデータ接続に関する基本的な説明です!
続いて、実際に分析する際に重要な用語である「指標」と「ディメンション」について紹介させていただきます。
まずLooker Studioの画面で説明すると、以下の赤枠の部分に指標とディメンションがあります。
前述でデータ接続が完了後、グラフを作成する際には必ずこの指標とディメンションを利用します。
指標とディメンションを簡単に表現する際の説明としてよく使われるのが「●●別の××のデータを見る場合」という表現です。
例えば、日本の人口の元データがあったとして、そちらを分析する場合、「●●(都道府県)別の××(人口)のデータを見るために棒グラフを利用する」と考えると用語を区別しやすいかと思います。
次からもう少し詳しくそれぞれの用語を解説します!
指標についてGoogleのヘルプページでは以下のように定義されています。
指標 – 値のセットに適用できる特定の集計です。指標自体には値のセットが定義されていないため、指標でグループ化することはできません。以前と同様、データソースの指標は青色のフィールドとして表示されます。
出典(Looker Studioヘルプ)
ちょっとこれでは理解しにくいと思いますので、簡単に言うと「数値で表現」可能なデータで、以下の図のように棒グラフで表すと棒の部分が指標です。
広告関係の指標だと・・・
広告表示回数
クリック数
コンバージョン数
クリック率
コンバージョン率
インタラクション率
エンゲージメント率
のようなものが挙げられます。
ディメンションについてGoogleのヘルプページでは以下のように定義されています。
ディメンション – データをグループ化できる未集計の数値のセットです。以前と同様、データソース内のディメンションは緑色のフィールドとして表示されます。
出典(Looker Studioヘルプ)
ちょっとこれでは理解しにくいと思いますので、簡単に言うと「分類するための軸」になるデータで、以下の図のように棒グラフで表すと軸の部分がディメンションです。
広告関係のディメンションだと・・・
キャンペーン
広告グループ
オーディエンス
クリックタイプ
コンバージョンカテゴリ
デバイス
曜日
時間
検索語句
週
のようなものが挙げられます
他のBIツールでもこの指標とディメンションの考え方は同じですが、若干表現は異なっています。
BIツール | 数値で表現可能なデータ | 分類の軸 |
---|---|---|
Looker Studio | 指標 | ディメンション |
Tableau | メジャー | ディメンション |
PowerBI | メジャー | 列 |
やはり企業としては他社の表現をそのまま利用したくなかったんでしょうかww
データ分析的な表現として、「質的データ」と「量的データ」があります。
質的データとは、分類したり種類を区別したりするためのデータ
※ そのままでは足したり引いたりといった演算はできません。
量的データとは、数値として意味があるデータ
※ そのまま足したり引いたりの演算ができます。
更に、質的データには「名義尺度」「順序尺度」、量的データには「比例尺度」「間隔尺度」がありますが、詳細は割愛させていただきます!
ここでポイントになるのが「質的データはディメンションになりやすい」「量的データは指標になりやすい」ということです。それぞれのデータが必ず紐づくわけではありません。
例えば、「国名」というデータで考えるとディメンションですが、「国名の個数」を集計する場合は指標として利用可能になります。
また、「気温」というデータで考えると指標ですが、「10℃台、20℃台・・・」などのように階級で表現する場合はディメンションとして利用可能になります。
このようなケースもあることを理解してLooker Studioを使っていくと、様々な表現ができるようになると思いますので是非参考にしていただければ幸いです!
以上が指標とディメンションに関する説明です!
お疲れさまでした!これでこちらの記事のゴールは達成です!
これでご覧の皆様もLooker Studioのデータ接続に関する基礎を把握している状態が整いました!
以上、本記事は終わりになりますので、ここまで読んでいただいた方は誠にありがとうございました!
Looker Studioに関する情報は以下のページでまとめておりますので、他にもLooker Studioの事例や基本的な情報が知りたい方は是非ご覧ください!