2016/3/23 Wed

第4回:広告分野におけるGoogleの研究について

TAG:

安井 翔太

株式会社サイバーエージェント アドテク本部 チーフデータアナリスト

2013年にサイバーエージェントに入社。入社前は、ノルウェーの大学院で応用経済学の研究をしつつ、環境税作成プロジェクトにデータアナリストとして従事。現在は経済学の考え方をデータ分析の切り口としてインターネット広告代理店の現場におけるデータ分析全般を担当。休日にもデータ分析をしており、自分の住む部屋をデータ分析で決めたりしている。

第4回:広告分野におけるGoogleの研究について

Googleといえば、ディープラーニングや機械学習における研究が近年注目を集めており、それらの研究結果は、SEMやディスプレイ広告の品質の向上に貢献しています。
しかしその一方でGoogleは、他にも広告の効果に関連する質の高い研究を多数行っています。今回はその中から3つのテーマに関する研究の内容をご紹介します。
研究の中身を一から解説するのはこのコラムのスコープから外れてしまうので、その根本のアイデアを紹介し、今日のマーケティングにどのような意味が出そうかをお伝えしたいと思います。
今回ご紹介する研究内容は全てこちらのページに公開されているものです。

広告キャンペーンの効果検証

おそらく現状Googleの出している広告効果検証に関連する論文の中で一番有名なのは、「Inferring causal impact using Bayesian structural time-series models」かと思います。この論文は、「広告の予算をあと1万円追加した時にKPIがどのくらい上がりそうか?」という所謂アトリビューションを加味した広告の効果に関する問いに答える為の統計的な手法を解説しています。
アイデアとしては非常に単純で、広告が出稿されていなかった時と出稿されている時の KPIを比較するというものです。
しかし、単純に比較をするだけでは大きな問題があります。例えば今週のダイレクトメールの KPIに対する効果を知りたいとします。ここで単純に先週との KPIの差を効果としてしまうと、先週と今週で変化している状況のKPIへの影響もその差に含まれてしまいます。仮にダイレクトメールと同時にSEMの出稿を増やしていれば、その増加分も含まれてしまいます。なので、ダイレクトメールの効果を知りたい際には、他の状況変化分、つまりここではSEMの変化分を差し引かれなければなりません。これをうまい具合に行える手法がこの論文で解説されているわけです。
この論文の概要の部分には、この手法の結果を用いて広告媒体間の最適な予算配分をするという可能性が示唆されています。また、この手法が利用するデータは日別の広告コストや関連するキーワードでの検索量など、非常に手に入りやすいデータで、様々な場所での応用が期待できます。Google Analyticsに搭載される日も来るのではないでしょうか?

パネルデータの拡充

あまり知られていないのですが、Googleは調査パネルのデータを分析する為の手法も研究しており、その成果を公開しています。例えば「Metrics and Design Tool for Building and Evaluating Probability-Based Online Panels」では、パネルデータの新しいアプローチであるProbability-based online panels(確率的方法に基づくオンラインパネル)についての包括的な情報がまとめられています。「確率的」とは、アンケートに回答する本人が、ランダムに選ばれている状態の事をさします。
従来のインターネット上の調査、例えば投票などでは、ユーザーが投票する場所に遭遇し自分の意思でアンケートに参加しています。よって、調査結果は「投票に自ら参加するような人」というバイアスがかかっている状態になり、消費者の適正な動向などを表さない可能性が出てきます。しかし、確率的なパネルデータではランダムに選ばれている人が回答するので、上記のようなバイアスがない状態を確保する事ができます。

しかし、この確率的に選んだパネラーを確保するには幾つか難しい点があります。一つはランダムで選別する必要性から大量のユーザーデータを保有している必要がある事です。もう一つは、ユーザーの離脱率を考慮する必要がある点です。長期的な調査をしている場合には、離脱によって欠損値が発生したり、データに偏りが発生してしまう可能性が生じます。こういった諸問題への対応が上記の論文ではまとめられています。
また一方でパネルデータにおいて欠損が発生している際に対応するための手法も研究されており、その成果が「How Many Millenials Visit Youtube? Estimating Unobserved Events From Incomplete Panel Data Conditioned on Demographic Covariates」でまとめられています。パネルデータではよくパネラーの記録ミスや不正等の理由によって、そのパネラーの行動の一部しか記録されていないという問題が発生します。
この論文では、YouTubeへのアクセスの記録ミスが発生しているパネルデータから、YouTubeでの正確なリーチ数の予測を行う手法を新たに打ち立て、実際のYouTubeのログと比較をする事でその手法の有用性を証明しています。論文の中では明記されていませんが、この手法はデータが損失している状態でもなるべく真実に違い状態を探れる可能性を示しているので、当然テレビやダイレクトメールといった計測が難しいオフラインのデータに対して利用する事が可能だと思います。

マス広告とオンライン広告の最適バランス

最後にご紹介するのは「Advertising on YouTube and TV:A Meta-analysis of Optimal Media-mix Planning」というテレビ広告とYouTube広告の最適な予算配分に関する研究です。ニールセンのパネルデータを利用して、あるGRPの量を投下した時にどの程度のリーチを得られるか?というリーチ予測モデルを作り、そこからYoutube広告との最適な予算配分を算出する手法を紹介しています。
このパネルではユーザー単位でどの番組を見ていたかが計測されているので、仮にある番組への出稿をやめた時にリーチがどのくらい減るかが算出できます。そこから過去に行われたキャンペーンで仮想的に番組への出稿を減らす事で、本来はなかったより少ないGRPでの出稿とその時のリーチを再現しています。そしてその再現結果とYoutubeでのリーチ単価(cpm=$20を元に計算)と比較し、過去のキャンペーンにおける最適なコスト配分を算出しています。この研究の面白いところはここで止まらずに、どういう広告キャンペーンの時にYoutubeへの出稿へとシフトするべきか?その時にどの位の予算を移し変える事が最適バランスになりそうか?という問いに答えるところまでを機械学習の手法で実現しているところです。結果キャンペーンの特徴を入力すれば、最適なTVCMへのコスト投下量とYoutubeへのコスト投下量を算出する事が出来ます。
この研究には様々な広告キャンペーンに関するパネルデータが必要になってくるので、まだ日本で同一の枠組みを適応するには時間がかかりそうです。ただ、こういった方法がもっと一般的になる未来はそう遠くない様に思えます。

さいごに

今回は3つの研究を解説しました。どの研究も、読んでいてハッとする様な発想を持った素晴らしい内容だと思います。そして何より面白いのはそういった内容の研究が広告の未来に繋がってくる未来がすでに見えているという事ではないでしょうか?
関連記事

TAG LIST