はじめましてこんにちは、新米データサイエンティストのh_matsumoto
(中身はやや古米)です。
今回は弊社で絶賛利用中のトレジャーデータのオプションサービスである
「Treasure Reporting (Reporting & Dashboarding)」をご紹介したいと思います。
docs.treasuredata.com
紹介動画
vimeo.com
「Treasure Reporting (Reporting & Dashboarding)」はSlemma社が提供する
BIツールをOEMとして利用しています。
slemma.com
トレジャーデータに格納されたデータを使って、レポートやダッシュボードを作成し
データの可視化を行う事が出来ます。
弊社でもデータの可視化にはシステムを改修して表示、クエリの結果をCSVとして
PythonやExcel上で処理する、他のBIツールを利用するといった用途に応じて対応
してきましたが、それらと比較しても中々便利に活用出来ます。
Treasure Reporting (Reporting & Dashboarding)の利用用途
- 1回限りではなく頻繁に確認する事がある
- 自分以外に共有する事がある
- 出来るだけ手間を掛けず、簡単に済ませたい
といった場合に非常に便利に活用する事が出来ます。
具体的なシーンで言えば、営業現場等からある数値を可視化し、毎日確認出来るよう
にしたいと要望があった場合などです。
逆に、1回限りそのデータの中身を可視化したい場合などには適しません。
導入方法
トレジャーデータを導入済みの場合は、担当されている営業の方へご依頼ください。
使い方
それでは実際に使い方をご説明いたします。
今回のサンプルケースとして、あるサイトのAndroid OSのバージョン毎のクリック件数を
毎日集計して、他者と共有可能なダッシュボードを作成する所までやってみます。
接続設定
右下にある+ボタンをクリックします。
integrationを選択します。
DatabasesのTreasure Dataを選択します。
トレジャーデータ側で発行されるアカウントのAPIkeyを入力します。
その他の部分は変更不要です。
入力後CHECK CONNECTIONがクリック出来るようになるので、クリックします。
Successが出れば成功です。失敗した場合はAPIkeyを確認しましょう。
最後にDONEを押せば設定完了です。
データセット作成
作成したコネクションを選択します。
画面の中心にChoose actionが出るので、Create datasetを選択します。
SQL Write SQL queryを選択します。
SQLを書いて、RUNを実行します。
SQLの実行が終わると、SQLを記述した下にデータ
フィールドとその中身を確認出来ます。
フィールドのverを選択します。
TypeのNumberをStringに変更します。
これはレポート作成の際に、データ分類に使う項目は
文字列ではないと使えないためです。
SQLの記述の際に数値データを文字列に変更していれば
変更は不要です。
データセットに名前を付けて、DONEを押して完了です。
レポート作成
作成したデータセットを選択します。
Create reportを選択します。
レポート作成画面が開きます。
デザイン設定
Chart type のPieを選択します。円グラフです。
AutorefreshをONにします。ONにすると編集内容すぐに
画面に反映されるようになります。
WedgesとMeasureの設定をします。
Wedgesにverを選択し、Measureにはクリック件数を選択しSUMを選択します。
設定が完了すると右側にグラフが表示されます。
下部のNEXTをクリックします。
フィルタリング設定
フィルタリングを設定します。
ここでは、Ver4.0と(何故か混ざっている0.0)
は件数が少ないのでグラフから除外してみましょう。
Dimensionのverを選択し
4.0と0.0にチェックを入れ、歯車マークを選択します。
Settingsでincludeにチェックが入っているのでExcludeを選択し
矢印で戻ります。Selected4 of 6(さっきはSelected2 of 6だった)
に表記が変わって、4.0と0.0が除外されているのが分かります。
変更内容を反映させるためDONEをクリックし、グラフの表示が変わったか確認したら
NEXTをクリックします。
並び替え設定
Sortはデータの並び替えです。デフォルトだとSQL実行時のデータソースの
並び順になっていますが、昇順、降順や手動で好きな並び順に設定可能です。
フォーマット設定
最後にフォーマット設定です。グラフにマウスカーソルを乗せれば数値の確認
は可能ですが、このままでは分かり辛いのでグラフに数値を表示させて、また
細かい数値も確認したいので実数値で表示させるように設定してみましょう。
Abbreviate thousands and millionsを選択し、画面遷移後OFFに。
これで数値の表示が実数値になります。
ELEMENTSタブを選択し、Labelsを選択します。
Show labelsをONにすると、設定項目が展開されるので
Connectorを選択し、Font sizeを24に変更します。
設定を変更すると、グラフに数値が表示されるようになります。
右下のDONEを押すと設定完了です。
左上のセーブアイコンをクリックすると、レポート名の入力画面と
保存先(フォルダを作成して管理可能)が選択できます。
保存後「←」で手前の画面に戻ると、作成されたレポートが確認出来ます。
ダッシュボード作成
右下にある+ボタンをクリックします。
Dashboardを選択します。
ダッシュボード作成画面が立ち上がるので、右上のINSERTを選択します。
Reportを選択します。
作成済みのReportがズラリと並ぶので、先ほど作成した「クリック件数」の
レポートを選択します。
ダッシュボード上にレポートが現れるので、見やすい大きさに変更します。
同じ手順で複数のレポートを追加できます。
また、New sheetを選択することでシートを追加し、タブを切り替えて表示
する事が出来ます。
レポートと同様にセーブアイコンをクリックし名前をつけて、保存先を選択
すると保存出来ます。
閲覧設定
画面右上の赤枠部分を選択します。
Share&exportを選択します。
Get linkを選択します
Link to shareに表示されているURLをコピーし
共有したい相手に知らせればブラウザで確認が出来ます。
下部赤枠に表示された部分でPWも設定できます。
以上です。
BIツールによっては、作成したダッシュボードを閲覧する際に有料のアカウントや
ソフトウェアのインストールが必要なケースがありますが、こちらはURLを共有したい
相手に教えれば良いだけなので、非常に簡単に利用する事が出来ます。
今回ご紹介したのはTreasure Reporting (Reporting & Dashboarding)の初歩的な
機能の使い方ですので、更に興味のある方や、詳しい機能を知りたい方については
こちらをご確認ください。
Knowledge Base - Slemma
最後に
ファンコミュニケーションズでは機械学習エンジニアを募集しています。
主な開発言語はScala, PHPですが、分析作業においてはPythonやRも多用しています。
また分析環境としてTreasure Dataを導入しているため、SQLによって学習データの作成・機械学習をシームレスに行うことができ、データクレンジングなどの雑務に追われることなく非常に大きなデータを扱える環境が整っています。
興味がある方は以下のページをご覧ください。(Webアプリケーションエンジニアと書いてありますが、機械学習エンジニアも含んでいますので安心してください。)