日々、取り扱うデータ量が増し、ビッグデータの活用用途も増えている昨今。マーケティング施策を実施する上でも、より素早く、大量のデータを解析していく重要性が高まっています。
そうしたなか、活用できるビッグデータ解析サービスに、Google社が提供する「Google BigQuery」があります。安価で誰もが使いやすいツールでありながら、高性能なサービスとなっています。
そこで今回は、Google BigQueryを初めて知る方にも分かりやすく、どのようなサービスなのか、機能や特徴、活用メリット、活用事例をご紹介します。
目次
Google BigQueryとは
Google BigQuery(グーグル・ビッグクエリ)とは、Google社のクラウドサービス「Google Cloud Platform(GCP)」の一つとして提供されるプロダクトです。
Google BigQueryを知るために、まずはGoogle Cloud Platformを理解しておきましょう。
Google Cloud Platformとは
Google Cloud Platformとは、Google社がクラウド上で提供するサービス群の総称です。
Google Cloudは、世界中にあるGoogle社 のデータセンターで稼働しているコンピュータ、ハードディスクドライブなどの物理的な設備と、仮想マシンなどの仮想リソースで構成されています。そのGoogle Cloudにあるソフトウェアやハードウェア製品を利用できるクラウドサービスが、Google Cloud Platformです。
例えば、何かのアプリケーションを開発したいときにGoogle Cloud Platformを利用することで、自身で開発に必要なハードウェアやサーバーなどを用意しなくて済みます。コストや手間を最小限に抑えて、開発に専念することができます。
Google BigQueryの特徴
Google BigQueryは、Google Cloud Platformで利用できる一つのサービスです。端的に言えば、大量データを瞬時に解析できるツールです。一般的にはデータウェアハウスに分類されます。
Google BigQueryでは、数TB(テラバイト)や数PB(ペタバイト)というビッグデータも、超高速で解析することができるのです。ちなみに、1TBは1,024GB(ギガバイト)であり、1PBは1,024TBです。
Google BigQueryは、ビッグデータの解析に活用できます。例えば、実際にマーケティング分野において、Webサイトのアクセス解析データを用いた広告改善や、Webサイトの顧客行動の分析改善に活用されています。
クラウドサービスのため、サーバーレスで導入が容易かつスケーラビリティがあり、コストパフォーマンスに優れています。また、Google Cloud Platformの提供する各種サービスと連携がスムーズに行えるのも特徴です。
Google BigQueryは、もともとGoogle社の社内では「Dremel (ドレメル) 」というデータ解析ツールでした。GoogleはDremelを用いてビッグデータの解析を行っていたのです。その後、Dremelの機能をGoogle BigQueryとして一般ユーザーに提供し、利用できるようにしたという経緯があります。
関連記事:Google Cloud Platform(GCP)とはなにか?特徴やAzure・AWSとの違いを解説します!
Google BigQueryでできること
Google BigQueryでできることをご紹介します。
Google BigQueryではビッグデータの解析はもちろん、大規模なクエリが可能です。クエリとは、データベースに対する命令のことです。ここでは、Google BigQueryを理解するために欠かせない「クエリ」という言葉について確認しておきましょう。
クエリとは?
クエリは英語で「query」と表記され、「問い合わせる」「訪ねる」などの意味を持ちます。IT分野で使われるときには、何らかのシステムに対して、データについての問い合わせや処理の要求などを指します。要求は、指定の形式に沿って文字に表現します。
例えば、データの抽出や更新などについて「こんな風に処理してください」という要求を文字列で表します。処理対象のテーブルやデータの抽出条件、並べ方などを指定して要求します。
Google BigQueryでできること
Google BigQueryでは、世界中のユーザーによって多くのクエリが処理されています。何千という数のサーバー群で、大規模なクエリを分散処理しているのです。
これによって、Google BigQueryでは次のことが可能です。
・データ分析
Google BigQueryでは、膨大なデータを解析することができます。近年はWebアクセスログを始め、様々なデータが取得できるようになりましたので、データ解析の種類も機会も増えました。その中でも、特に膨大なデータを超高速で解析するのに向いています。リアルタイムでの解析も可能であるため、迅速な経営判断や戦略策定に役立ちます。
・データ保存
大量にデータを格納する場所としても利用できます。アクセス解析の膨大なデータやCSVファイルなどのデータを格納しておき、処理することができます。
・各種Google提供ツールとの連携
Googleが提供するツールと容易に連携できるので、活用の幅が広がります。例えば、アクセス解析「Googleアナリティクス」と連携ができるほか、BIツール「Googleデータポータル」との連携も可能です。
連携するメリットは、Google アナリティクス単体では実施できなかった分析もGoogle BigQueryを利用すれば実施できるようになったり、GoogleデータポータルにおいてGoogle BigQueryによる分析結果を視覚的に示すことができたりと、利便性が高まります。
関連記事:クエリ(query)とはなにか?SEO、IT用語として使われている様々な意味を解説
関連記事:Googleデータポータルとは?基本的な概念と使い方を解説
Google BigQueryの特徴
Google BigQueryには、どのような特徴があるのでしょうか。ここでは4つの特徴をご紹介します。
データの処理速度が速い
Google BigQueryは、先述の通りTBやPBといったような大きな容量を持つデータでも、高速でデータ解析を行うことができます。
Google BigQueryのストレージに自身のデータをインポートすれば、外部のデータソースにおいてクエリを実行する場合よりも、高速に処理ができます。膨大なデータの高速解析のみならず、リアルタイム分析などにも役立ちます。
高性能かつ安価=コストパフォーマンスが高い
Google BigQuery高性能かつ安価であるため、コストパフォーマンス高く利用できると言われています。手軽に膨大なデータ量の解析ができるというのは、一からサーバーを用意して実施した場合と比べると、かなりお得と言えます。さらに、他の同類サービスと比べても使い勝手や規模感、高速度合いなどは引けを取らないでしょう。
では、価格面はどうなのでしょうか。そもそも、Google BigQueryの料金は、クエリ処理による分析料金と、ストレージ利用料金の2つで決まります。
分析料金はクエリ処理の頻度に応じて変動するため、頻度が少ないのであれば価格は低くなるでしょう。一般的にはストレージは使用せず、分析のみの利用が想定されるため、多くの企業では安価で利用することができると考えられます。
無料で利用できる期間も設けられていますので、まずは試しに利用して性能を確かめてみることをおすすめします。分析料金は毎月1TBまで無料で、ストレージ料金は毎月10GBまで無料です。また、コストの目安を事前に見積もることができるため、予め費用対効果を確認できることもメリットと言えるでしょう。
なお、無料期間が過ぎても分析料金はクエリの実行時だけサービスが起動しますので、従量課金モデルであればサービスが起動している間しか料金は発生しません。これは、同様のサービスと比べて安価に利用することができるということです。料金モデルについては後ほどご紹介します。
データベースの専門知識がなくてもOK
Google BigQueryは、データベースに関する専門知識がなくても使えます。というのも、Google BigQueryの対抗馬となるのは、他社製のデータウェアハウスです。データウェアハウスとは、大規模なデータ分析システムを指します。
一般的なデータウェアハウスでは、データベースに関する専門知識が必要になることが多いです。例えば、通常であれば分析を始めるにはサーバー構築や設定の最適化などが必要になります。ですが、Google BigQueryは、サーバーレスで利用できますし、データベースのチューニングも不要なため、操作さえ覚えてしまえば分析できてしまうというわけです。
とはいえ、データベース言語であるSQLを記述してデータ処理を行うことが多いため、SQLを理解している必要があります。Google BigQueryは、基本的にWebブラウザ上で起動することができ、SQLをWeb上の画面のフォームに記述することでデータの処理を行います。画面構成もシンプルであり、画面の上部に「クエリエディタ」があり、そこにクエリを記述して実行できます。
SQLとは、大量のデータから指定の条件のデータを選び出したり、データの追加や削除を行ったりする命令ができる言語です。SQLの基本的な命令文は、データ取得、データ追加、データ更新、データ削除の4つだけです。これらの言語を利用してクエリ実行を行います。
SQLは、それほど難しい言語ではないと言われており、Google BigQueryを活用するためにマーケティング担当者がSQLを学び始めるということは、近年よくあることのようです。
Googleの各種サービスとの連携ができる
Google BigQueryは、Google社が提供する各種サービスとも連携できるので、マーケティング施策を実行する上でデータを活用しやすいのが特徴であり、メリットです。
Google BigQueryで連携できるサービスには、例えばGoogleスプレッドシートやGoogle アナリティクス、Google Firebaseなどがあります。それぞれ、連携することでできることを見ていきましょう。
・Googleスプレッドシートとの連携でできること
Google スプレッドシートとは、Webブラウザ上で表計算ができるサービスです。Microsoft Excelで実施できるような図表作成や表計算を、オンラインで行うことができます。
Google BigQueryをGoogle スプレッドシートと連携することで、レポーティング作業の運用効率化などが可能になります。例えば、Google BigQueryから抽出したデータを用いて、Google スプレッドシートでグラフを作成することができます。一般的に、Google BigQueryのデータ解析結果を可視化するためにBIツールを連携させますが、簡易的にグラフ化したいという場合には、Google スプレッドシートで便利に行うことができます。
・Googleアナリティクス(Analytics)との連携でできること
Googleアナリティクス(Analytics)とは、Webサイトのアクセス解析サービスです。Google アナリティクスによって取得されたユーザーのWeb上の行動データをGoogle BigQueryにエクスポートすることで、Google BigQuery上に読み込んだその他のデータと組み合わせて分析をすることができます。Google BigQueryと連携することで、より詳細な分析ができるようになります。
・Google Firebaseとの連携でできること
Google Firebaseとは、モバイルアプリを迅速に開発できるプラットフォームです。高速にモバイルアプリを開発できるだけでなく、アプリケーションを利用するユーザーの行動をデータ化するなど、モバイルアプリ開発と運用に役立つ機能が豊富に用意されています。
Google BigQueryと連携することで、Firebaseで取得したユーザー行動などのログをGoogle BigQueryで解析するといった高度な活用が可能になります。Firebase単体では知り得なかったことが分かるようになると考えられます。
関連記事:Googleスプレッドシートとは?使い方や特徴、Excelとの違いについて解説!
関連記事:Google Analytics(グーグルアナリティクス)とは?設定方法や使用用途を解説
Google BigQueryで大規模データの高速処理ができる理由
Google BigQueryは、なぜそこまで高速処理ができるのでしょうか。それには次の2つの仕組みが特徴的であることが理由だと、Googleは説明しています。
1.カラム型データストア
一つは、カラム型データストアであるという点です。
クエリ処理を行う際、通常のデータベースの場合はデータを読み込む際に「行単位」かつ「横方向」に読み込んでいくのが一般的です。ですが、Google BigQueryの場合は「列単位」かつ「縦方向」に読み込んでいるのだそうです。
これによって、なぜ高速化が可能になるのでしょうか。データを横方向に読み込んでいく場合には、データ全体を読み込む必要があります。一方、データを縦方向に読み込んでいく場合には、読み込む必要のあるデータの列のみを読み込むだけで済みます。つまり、クエリの対象となる列のデータだけにしかアクセスしないため、トラフィックが最小化できるとされます。
さらに、同じ列に含まれるデータは類似性が高いことから、データのばらつきが少ないことで、高い圧縮率を実現します。一般的に、データの中に反復パターンが存在すれば、データ量削減のために圧縮がかかり、反復パターンが多ければ多いほど、圧縮率は高くなります。Google BigQueryでは、列単位・縦方向に読み込む仕組みであることから、圧縮率高くクエリ処理が行えるということです。
2.ツリーアーキテクチャ
もう一つは、ツリーアーキテクチャである点です。ツリーアーキテクチャとは、クエリがツリー状に広がっていく構造になっているものです。
クエリ処理を実行する際に、そのクエリを受け取るのはルートサーバーです。そして実際にクエリ処理を実行するのは、多数のリーフサーバーになります。このルートサーバーから各リーフサーバーへとツリーのようにクエリが広がっていくことで、並列でデータ処理を行うことができる仕組みになっています。並行して処理されることにより、大規模なデータの高速処理を実現できるのです。
Google BigQueryの利用方法
Google BigQueryを初めて利用する際には、次の手順で利用開始することができます。まずは無料トライアルから始めましょう。
1.Google BigQueryの公式サイトにアクセスする
Google BigQueryの公式サイトにアクセスします。
2.「Google BigQueryの無料トライアル」を選択する
トップページにある「Google BigQueryの無料トライアル」のボタンをクリックし、画面が切り替わったら案内に従って必要なアカウント情報や支払情報などを入力します。
まずはGoogle Cloud Platform(GCP)に登録する必要があり、登録にはクレジットカードが必要になります。
無料トライアルを開始後、「やっぱり利用は一旦、保留にしたい」ということもあるでしょう。その場合は、クレジットカード情報を入力すると自動課金されてしまうのではないかと不安になりますが、無料トライアル期間が終わっても自動では課金されないことが明記されています。
入力が完了すると、Google Cloud Platformに登録が完了し、Google BigQueryの利用ができるようになります。
3.Google BigQueryを選択する
Google Cloud Platformの画面が開きます。すると画面左側にナビゲーションメニューが現れますので、「Google BigQuery」の項目を選択します。
Google BigQueryはこれでいよいよ利用スタートできます。プロジェクトを作成し、データを読み込んでクエリ実行を行っていきます。
Google BigQueryの料金
Google BigQueryを利用するための料金について確認していきましょう。
クエリの処理にかかる分析料金と、データを保存するストレージ料金の2種類があります。分析料金とストレージ料金は、それぞれ無料枠が用意されています。分析は処理されるクエリデータについて毎月1TBまで無料、ストレージは毎月10 GBまで無料です。
1.クエリの処理にかかる分析料金
分析料金では、オンデマンド料金と定額料金の2種類の料金モデルが用意されています。オンデマンド料金とは、各クエリによって処理されたバイト数に基づいて課金されるもので、つまり従量課金ということです。
定額料金とは、仮想CPUであるスロットを購入することで定額利用ができるもので、クエリの実行に使える専用の処理容量を購入したということになります。定額料金は長期的な利用者向けで、契約種別によって割引価格で提供を受けられ、両方の料金モデルを組み合わせることもできます。
2.データを保存するストレージ料金
ストレージ料金は、Google BigQueryに読み込むデータを保存するのに必要な費用です。アクティブストレージと長期保存、2種類の料金モデルがあります。
過去90日以内に変更されたデータはアクティブストレージの対象となり、過去90日以内に変更されていないデータは長期保存の対象となります。長期保存の料金は自動的に約50%値引きされます。
上記は2023年3月時点の情報となり、料金は変更になることが多いため、契約時には公式サイトを確認してください。
■Google BigQueryの活用成功事例
Google BigQueryは、すでに国内外で有効活用されています。ここでは4つの事例をご紹介します。
●広告運用の業務改善
・サマリー
ある不動産関連企業は、Google BigQueryをはじめとしたGoogle Cloud Platformを活用することによって、マーケティングの業務改善を成功させました。年間、約4万2,000時間の工数削減を見込んでいます。
・成果
マーケティングにおいて、Webサイトのアクセス解析にGoogle アナリティクスを利用しています。そのアクセス履歴データをGoogle BigQuery に転送し、広告媒体側の実績データと社内システムの顧客の契約実績データを組み合わせて、機械学習モデルにより広告キャンペーンの評価を実施しています。
データ分析基盤をGoogle BigQueryに統一することで、Webサイトと広告、契約との相関関係を捉え、集客活動が直接契約につながったかどうかを把握できるようになりました。
●ECサイト運用のデータ活用
・サマリー
ECサイトを運営するある企業は、Google BigQueryを用いたデータ分析基盤を新しく構築することで、総計100億レコードという膨大な量のデータ活用を実現しています。
・成果
同社は従来、オンプレミス環境で扱っていたデータをGoogle BigQueryに移行したことで、扱えるデータ量が10倍になりました。従来はデータ分析に約2時間かかっていたところ、Google BigQueryでは2~3分で終了できるようになりました。これによって、産出できるレポート数も10倍に増えました。
また、Webのアクセスログと受注データを紐付けて分析するなどの新しい試みも実施できています。
●購買データの高速分析・活用
・サマリー
GMS(総合スーパー)事業を営むある企業は、年間のべ数億人もの顧客による膨大な購買データをGoogle BigQuery によって高速に分析・活用しています。
・成果
保有する膨大な購買データや行動データの収集・分析のための環境として、Google BigQueryの導入を視野に入れ、Google Cloudの導入を決めました。
以前よりアプリを使ってユーザーデータとPOSの購買データを紐付けて分析していましたが、当時は一つの分析に 30~40秒要していたため時間がかかりすぎ、新しい施策の検討すら十分にできていない状況でした。
データ分析基盤をGoogle BigQuery にリプレイスした後、一つの分析は5秒で完了。正確な分析に基づく施策の振り返りや、次回の戦略立案がスムーズに行えるようになりました。
●データ活用基盤構築によるデータ活用の民主化
・サマリー
ある建材・設備機器メーカーは、Google BigQuery を中心としたデータ活用基盤を構築し、専門知識のない社員でもデータを必要なときに利用できる、データ活用の民主化を推進しています。
・成果
同社は、スピードが加速するビジネス環境を踏まえ、データによる事実に基づくデータドリブンな意思決定が必要不可欠と考えました。意思決定をスピード化するには、社員が必要なときに必要なデータを自ら利用可能な環境が必要と考えました。
そこで、データ活用基盤を構築した際に、マーケティング担当者が使用実績のあったGoogle BigQueryを中心にシステムを設計。その結果、誰もが手軽に蓄積されているデータを検索できるようになり、データ活用が一気に進みました。従来のシステムでは不可能だった大規模なデータ分析が可能になり、課題解決も進みました。
Google BigQueryは、どの事例においても大規模データを高速処理することができ、誰でも扱いやすいというメリットが活かされているのが分かります。特にマーケティング担当者といったデータ分析の専門家ではない人員でも活用しやすい点は、大きな特徴と言えるのではないでしょうか。
関連記事:データドリブンの意味とは?データ分析の基礎知識と重要性、データドリブンマーケティングを解説
まとめ
・Google BigQuery(グーグル・ビッグクエリ)とは、Googleのクラウドサービス「Google Cloud Platform(GCP)」の一つとして提供されるデータウェアハウスである。
・マーケティング分野においては、Webサイトのアクセス解析データを用いた広告改善や、Webサイトの顧客行動の分析改善に活用されている。
・Google BigQueryでは、データ分析、データ保存、各種Google提供ツールとの連携などが行える。
・Google BigQueryの特徴として、「データの処理速度が速い」「高性能かつ安価=コストパフォーマンスが高い」「データベースの専門知識がなくてもOK」「Googleの各種サービスとの連携ができる」などがある。
・Google BigQueryで大規模データの高速処理ができる理由は、「カラム型データストア」「ツリーアーキテクチャ」の2点の仕組みが大きいと言われる。
・Google BigQueryの料金は、分析料金とストレージ料金がある。分析料金には従量課金モデルと定額モデル、ストレージ料金にはアクティブストレージと長期保存、それぞれ2種類の料金モデルがある。