2015/2/16 Mon

第1回:油田と戻りCVの意外な関係

TAG:

第1回:油田と戻りCVの意外な関係

安井 翔太

株式会社サイバーエージェント インターネット広告事業本部 チーフデータアナリスト

2013年サイバーエージェントに入社。 入社前は、ノルウェーの大学院で応用経済学の研究をしつつ、環境税作成プロジェクトにデータアナリストとして従事。現在は経済学の考え方をデータ分析の切り口としてインターネット広告代理店の現場におけるデータ分析全般を担当。 休日にもデータ分析をしており、自分の住む部屋をデータ分析で決めたりしている。

初めまして、株式会社サイバーエージェント インターネット広告事業本部にて、データアナリストをしている安井です。
代理店部門の錚々たる方々に並んでようやく入社2年目に突入しようかという僕がコラムを書かせて頂くのは中々恐縮なのですが、データ分析を行っていく中で僕が見て来た広告の世界をお伝えすることが出来ればと思います。
どんなテーマをどのくらいマニアックに書くのか?というのは、結構難しいところなので、色々と試行錯誤していく事になるかと思いますが、どうぞよろしくお願いいたします。

さて、今後を占う第1回のテーマは「油田と戻りCVの意外な関係」です。
2011年10月、僕はノルウェーにある Norges Handelshøyskole という大学院に在籍しており、そこで一つの数式(モデル)に悩まされていました。その数式とは、ある油田をこれから開発する時に初期投資の規模から、今後何年で枯渇するか?という予測を行う為のものでした。
当時文系から理系へと転向したばかりで、モデルの数式から意味合いを読み取ることが出来なかった僕は、悩みつつも必死にそれを暗記することで試験をパスしようと試みていました。
そんなモデルの根幹部分には、このような式が入っていました。

q_t=q_0 e^(-kt)

この式の直接意味するところは、石油の年間生産量q_tは初年度の生産量q_0から一定のペースe^(-kt)で減少して行くと言う物です。しかし、ここには一見すると数式には記述されていない隠されたアイデアがありました。
油田における石油の年間生産量は、油田の圧力によって左右されます。圧力が高ければ石油がより多く吹き出すので生産量が増えます。しかし、石油が吹き出すと油田から圧力が失われてしまいます。
つまり、今の生産が多い程、次の生産が少なくなってしまうという仕組みを持っているのです。

実は一定のペースe^(-kt)という部分は、このアイデアを考慮して選定された物だったのです。
この数式に数年分の油田の産油量データを当てはめると、上の仕組みをちゃんと加味して、今後産出量がどのように減って行って何年後に石油の生産が止まってしまうか、ということを教えてくれました。
奇妙なことに、そんなモデルを勉強していたという記憶も消えかけていた2014年に、似たようなことをしたいという依頼をクラアイント様より頂くことになりました。

依頼はシンプルなもので、前月配信からの戻りCVの概算値を出したいという内容でした。
そのクライアント様は、先月まで普通に配信していたある広告媒体が月初に停止しており、その広告に触れていたユーザーがCVを発生させると、広告を配信していないのにCVが計測される状態になっていました。
こういったCVの事を「戻りCV」と呼んだりするのですが、問題なのは、この広告を再開した時に計測される数字に、この「戻りCV」と、再開後の広告の効果で至ったCVが入り混じってしまうことでした。

仮にこのままCPAを計算したとしても、先月のCVがタダで上乗せされているので、結果として安めのCPAが出てしまいます。よって、ここで手元のデータから「戻りCV」分を推測し、計測された値から引いて、適正と思われる値を算出する必要が発生します。

石油モデルの出番が再びやって来たわけです。
ここで僕が立てた(というかパクった)モデルも全く同じもので、

〖CV〗_t=〖CV〗_0 e^(-kt)

という数式でした。
産油量だったqがCVに変わっただけで、出稿が終わった日の〖CV〗_0から一定のペースe^(-kt)で計測されるCVが減少して行くという意味合いです。

さて、ここで僕が石油のケースと同じe^(-kt)を使ったのには、完璧とは言えないながらもそれなりの理由があります。
ひとつは、「戻りCV」も石油も限られた物が減って行くという点で同じです。広告をクリックしていないユーザーは、後でCVしたとしても計測に含まれないので、「戻りCV」の数には必ず限りがあります。
よって、石油のモデルと同じ様に一方的な減少をたどるモデルが適正だと思えました。

残る問題は、“どんなペースで減少するのか?”でした。
広告をクリックした人がCVをする確率は日が経つにつれて少なくなりそうで、一度CVしたユーザーがもう一度計測されること事も無かったため、石油と同様のペースで減少しそうに思えました。当然最後の決め手は、実際に受け取ったデータがそれに適していそうだったからなのですが(笑)
結果的に「戻りCV」が差し引かれた場合の数値を出すことが出来、急な依頼に対し、僕の記憶の引き出しにあった方法で対処出来たことにそっと胸をなで下ろしました。

このように、他の分野で使われているモデルを広告の用途に合わせて応用してみるということを、日々の業務で行っています。今回の例の様に、スルッと上手く行くケースもあれば、上手く行かずに数週間悩んでしまうケースもあります。
ただ、悩んでいる時も上手く行っている時も、自分の好奇心が沸き立っているのを感じながら鼻息荒く課題に取り組んでいます。
次回も、そんな僕の日々の業務での興奮が、少し位はお伝えすることが出来たら良いなと思います。
関連記事

TAG LIST