Office365 Power BI で Google アナリティクスデータを!

はじめに

Office365 の中でもこの Power BI だけが取り付きにくい感じのソフトでした。それは私の知合い達も同じで普段の忙しさの中で Power BI を勉強する事って出来ないようです。分かったら教えてね。という感じです。
そこで普段とは違って Microsoft Power BI のガイド付き学習 をゆっくり時間を掛けて勉強してみました。そしたら何となく理解出来て来ました。

BB の理解する Power BI って、これから先、社内のデータが段々とクラウドに置かれるようになるという事。それにインターネット上には色々な統計データや資料がたくさん存在し、それらを Power BI を使って簡単に取り込む事が出来る。という事で、それら外部のデータと社内のデータとを組み合わせて部署によって本当に必要な最新のデータのみを見やすく理解しやすいようにたくさんのグラフの中から選択して表現し、目標達成型のグラフ作成を行うツールという感じに受け止めました。

Power BI について

お試しで Power BI を始められる場合は、Power BI Desktop の概要 から無料ダウンロードが行えます。
BB の場合は、Office365 の E3 プランを使っていますので下記よりスタートする事が出来ます。

「Office365の管理センター」を開き、「アプリ起動ツール」アイコンをクリックし、そこでは表示されないので「すべてのアプリ」をクリックして「Power BI」をクリックします。

下図が Power BI の画面です。
これは、目的のグラフなど作成して使う場合に利用します。目的のグラフを作るには Power BI Desktop の方を使います。

Power BI Desktop のダウンロードは下記から行って下さい。

なお、Power BI には、Power BI Pro と Power BI Premium それに試用版の3種類があります。

Power BI Pro

  • ユーザー当たりの月額 9.99 ドル
  • セルフサービスの最新 BI 、Office365 E3ユーザーが利用可能
  • コラボレーション、公開、共有、アドホック分析など
  • Microsoft による完全管理 
  • 一般的には、Pro 版で十分だと思います。

Power BI Premium

  • ユーザー当たりの月額 4,995 ドル
  • Enterprise BI、ビッグ データ分析、クラウドおよびオンプレミスのレポート
  • 高度な管理およびデプロイの制御
  • クラウド コンピューティングとストレージの専用リソース
  • すべてのユーザーに Power BI コンテンツの利用を許可

無料版とPro版の違い                     (×:無料版、レ:Pro版)

Power BI 画面について

下図が Power BI Desktop の画面です。
しかし、Power BI Desktop を起動した時に下の黄色い画面が上に表示されます。この画面は何か一つの事を行った後は消えてしまいます。ですから出来るだけ黄色い部分だけを使って右側の「データ取得」などはこれを閉じた状態の下図を使った方が良いと思います。

Power BI Desktop 画面

Power BI Desktop の初期画面

Power BI を勉強していて「データ取得」と言うところで 「 Google アナリティクス 」という項目が表示されていたのです。BB にとっては凄く興味のあるデータです。Google アナリティクス データを Power BI で使えるなら凄く分かりやすいし凄いですよね。是非、やってみたい。と思いました。

実際、やってみて上手く行かなかったのです。が、これを記事にしてみたいと思います。
「こうしたら大丈夫だよ!」とご存知の方がいらっしゃいましたらご教授、宜しくお願い致します。

Google アナリティクスを使ってみましょう

Power BI Desktop 画面の左上の「ファイル」から下図のように「データ取得」、「その他」をクリックします。

すると下図の「データ取得」画面が表示されます。すべての欄でスクロールバーを下方向に下げて行くと「Google アナリティクス」が表示されます。そこで「接続」をクリックして下さい。

最初は、Google アナリティクスのアカウントやパスワードの入力画面がありますので自分のID、パスワードを入力して下さい。

下図は、BB が Google アナリティクスに設定して使っている内容が表示されています。
このサイトをご覧の方は URL を確認して頂ければわかると思いますが

https://cyber-bb.jp がメインで Windows10 についてのサイトを作成しています。
https://cyber-bb.jp/Office365 がこのサイトで、Office365 に使っています。ここのデータを Power BI で見てみたいのです。

ここで「すべてのウェブサイトのデータ」をクリックして下にある「読み込み」ボタンがクリック出来ればいいのですが、これ以外のどのフォルダをクリックしても読み込みが行えません。

上から順にクリックして行くと Page path level2 まで表示されました。

しかし、Page path level3 から 4 までと Page Title 、Previous Page Path 、Second Page がエラーになってしまいました。

Page path level3 をクリックした状態で「読み込み」ボタンをクリックしましたがデータは取り込めません。

最初からやり直しして、Page path level2 をクリックした状態で「読み込み」ボタンをクリックしたらデータ読込を行いました。

Page Tracking 部分のみを分からないままに読み込みしたので活用出来ないデータだけになってしまいました。

これをご覧になられて間違いに気づかれた方、ご指摘をお願い出来ないでしょうか?宜しくお願いします。

Power BI Desktop とは何ですか?から再勉強とまとめ

データアナリストの一般的な使い方として下記の順番で勉強して行きます。

  1. データへの接続
  2. データの変換、不要データの削除を行いデータモデルを作成する
  3. 多数のグラフの中から分析・理解しやすい最適な視覚的表現を行う
  4. 1ページまたは複数ページのレポートを作成する
  5. レポートを他のユーザーと共有する

 

1.データへの接続

今回は「Google アナリティクス」の「行動」「サイトコンテンツ」のデータをひと月分エクスポートし、「ダウンロード」フォルダに保存されているファイルの中からシート名の[サマリー]と[データセット2]は削除した分を使ってみたいと思います。

「ファイル」をクリックして「データ取得」とクリックして下さい。
ここでは、最初の方は社内の Excel ファイルを使って練習してみましょう。

左側のデータセット1のところの㋹チェックを入れると右側のデータセット欄にデータが表示されます。

データが読み込まれて下図のようになります。

前画面で、「読み込み」の横も「編集」ボタンをクリックしてもいいのですが、BB は下記画面の「ホーム」タブをクリックして「クエリを編集」をクリックする方法で「Power Query エディター」画面を開きます。

2.データの変換、不要データの削除を行いデータモデルを作成する

この「Power Query エディター」は、これから行う処理を画面右側の「適用したステップ」というところに記憶してゆくのです。もちろん削除もOKで凄く良く出来ているエディターです。

まず、[ページ][ページビュー数][ページ別訪問数][平均滞在時間][閲覧開始数]を選択し、「列の削除」から「他の列の削除」を行います。

データの最終行に合計欄があります。これを「行の削除」「下位の行削除」を選択し、何行削除するかの質問画面が表示されますので 1 を入力してOKします。

URL の中に /cache.aspx? や /search?q など ? が含まれる行の削除を行う。
この処理、色々調べたのですが良くわからず今のところ適当にやっています。

「列の追加」タブから「カスタム列」をクリックします。

新しい列名:文字列?の位置
カスタム列の式:Text.PositionOf([ページ],”?”)

関数リファレンス
https://artfulplace.net/docs/powerquery/fn/text/
Text.PositionOfの説明
https://www.powerquery.io/text/text.positionof
を参考にさせて頂きました。

「文字列?の位置」のフィールドが追加され、文字列の位置が数字で代入されました。
-1 の値は、URL に ? が含まれない BB の欲しい行です。0 より大きい値の行が削除してもいい行になります。

-1 の値欄にチェックをつけ OK をクリックして ? が含まれる行を削除します。

もう一つ /entry/2018/04/15/121521 などの不要なデータもあるので /entry/ で検索して削除します。なお、この方法は ? を削除した仕方と同じ方法で行えます。

新しい列名:文字列 entry の文字位置
カスタム列の式:Text.PositionOf([ページ],”/entry/”)
この結果から -1 のデータのみを残しました。

上記で新しく 2つのフィールドを作成した分を削除して、名前を「PGのPV訪問数」とし「ホーム」タブの「閉じて適用」をクリックしデータの編集を終わりたいと思います。

これで Power BI Desktop 画面は下図のように、フィールド欄に「PGのPV訪問数」の名前が表示されフィールドも整理された分が表示されました。 

項目マスタの作成

Googleアナリティクスのデータだけではグラフが視覚化してもサイト名がわかりにくかったのでサイト名マスタをエクセルで作ってみたいと思います。

サイト名マスタは、Googleアナリティクスデータ「PGのPV訪問数」をコピーして作成し、ページの列以外を削除して、新しく列名を[サイト名]、[区分]を作成しデータは手入力で入力しました。その後、「ホーム」タブの「テーブルとして書式設定」をクリックして保存しました。

サイトの省略名の追加

いざグラフを作ってみようとしたらサイト名の文字列の長いままに気づきました。
何かの動画で「AIインサイト」を使ったデモがあったので用途は違いますが AI を使って出来ないかなーと調べてみたのですが Azure Machine Learning の世界に入って行かないと駄目だったので今回は諦めました。

それでやってみたのが「例からの列」です。

多分、これは新しく出来た「カスタム」という列に、ここでの目的である省略サイト名をサイト名を見ながら手入力して行くと、[URL][サイト名][種別区分]を参考にして Power BI が自動的にルールを調べて全ての省略サイト名を付けてくれる。という優れもののようですが、残念ながら今回の目的には自動表示されず null 表示になってしまいました。

リレーションの作成

「PGのPV訪問数」のページと「サイトマスタ」のページとをリンクを設定します。

3.多数のグラフの中から分析・理解しやすい最適な視覚的表現を行う

「視覚化」は、Power BI Desktop の下記の赤い枠のグラフを使って行って行きます。
又、視覚化に使うデータは、その横の「フィールド」欄にあるデータを使用します。

グラフをセットしてみる

  1. 「視覚化」のグラフの種類から「集合縦棒グラフ」を選択します。
  2. 「サイトマスタ」から「省略名」を「軸」欄にドラッグして設定します。
  3. 「PGのPV訪問数」から「ページビュー数」をドラッグして設定します。
  4. グラフ自身は小さく表示されるのでグラフ右下にカーソルを当てドラッグして大きくします。

フィルターを使ってみる

  1. フィルターの中で「ページビュー数」に下記より条件を付ける
     
  2. 2000 を代入する
  3. 「フィルターを適用」をクリックする

で下記のように見やすいグラフに作成できます。

グラフを「集合横棒グラフ」に変更します。

  1. フィルターで「省略名」を選択する
  2. グラフに表示して欲しい「省略名」に㋹チェックを付ける

グラフの種類や軸、値に設定するフィールド、それにフィルターなどでも色々な視覚化ができそうです。

4.1ページまたは複数ページのレポートを作成する

今まで作成した 1 個、1 個をビジュアルのコレクションと呼びます。
ここで作成した Power BI Desktop ファイル内のビジュアルのコレクションをレポートと呼び、左下にあるページを追加してたくさんのレポートを作成する事が出来ます。

レポートに設定したコレクションは、サイズの変更を行ったり、削除したり、移動したりと見やすいように表現する事が出来ます。

5.レポートを他のユーザーと共有する

「ホーム」タブの「発行」をクリックして共有を行います。

発行する宛先を選択します。ここでは「マイワークスペース」を選択します。

WEB上でレポートを開いてみます

Office365の「管理ツール」かOffice365のメニュー画面から「Power BI」を開きます。
右側の縦メニューの「マイワークスペース」をクリックします。

「レポート」が表示されますので、自分が作成した Power BI のファイルをクリックします。

下図のようにレポートが開きます。

一応、これで完了です。

今後は、Googleアナリティクスデータを処理年月を含めたデータベースを作成したり、地域別のデータも組合せたりして役立つ Power BI に仕上げて行きたいと思っています。