AI化が進むデジタル広告の運用実践法 - データドリブン・コンサルティング/Data Driven Consulting

AI化が進む中で人間がやるべきこと

昨今機械学習を中心としたAIの技術が急速な進歩をみせ、ChatGPTの登場とともに、一般の消費者にとってもその有用性が急速に浸透しつつある。ただ、デジタル広告の世界に２０年携わっていると、自分の仕事にAIが介在するという状況はだいぶ昔から起こってきたことで、それほど目新しいものでもない。

もちろんGoogleやMetaなどにおいては、相当昔から内部でAIが広告の最適化に使われていたと思うが（もしかしたら最初から？）、少なくても私のようなデジタル広告主の立場で決定的に自分の仕事にAIが入り込んできたと感じたのは、2017年くらいにGoogleがUniversal App Campaign（UAC、現Googleアプリキャンペーン）という商品を市場投入したころくらいからである。UACの登場くらいから、広告主が広告運用でコントロール可能なパラメーターが急速に減ってきて、アプリの獲得キャンペーンなどでは、目標の登録CPAやROASとクリエイティブと広告予算を設定するくらいしか運用上出来ることがなくなってきた。あとは、GoogleのAIが機械学習を通じて広告主の指定した条件を実現すべき広告のコントロールをしてくれるということになっている。

あまりこういうことを公言するとメディア各社に怒られる気がするが、「コントロールしてくれることになっている」という言い方をしたのは、残念ながらそんなに簡単にことは運ばないからである。

この文章を書いているのが2024年3月なので、UACの登場以来6－7年くらいが経過している。始めてUACの話を聞いたときには、正直簡便してくれと思った。理由は2つである。ひとつは、運用のパラメーターを殆ど取り上げられてしまったため、自分の活動をコントロールすることが出来なくなってしまう事への不満。もう一つは、そもそもそんなことが実現してしまっては、デジタルを中心としたマーケティングを生業としている人間の商売あがったりで、付加価値がなくなってしまうではないかという根本的な不安である。

しかし、6－7年AIと毎週毎週継続的にお付き合いしていると、AI前の方が自分のやっていることをコントロールしやすかったという回顧主義的な思いはありつつも、誰にでも上手に使えるものではないことが分かってきた。

私はAIのエンジニアでもなく、AIの機械学習モデルのアルゴリズムを理解しているわけでもないので、いつもながら専門家の方から間違っていると言われることもあると思うが、ユーザーとしてAIの機械学習と向き合ってきた立場から、AI化が進むデジタル広告と上手に付き合い、高いパフォーマンスを出すために必要なだと思うことを紹介したいと思う。

Free to Playの顧客獲得の事例で考える

まず始めに、前回の復習からしたい。パフォーマンスマーケティングで最も重要なことは、購入者CPAを低くすることであるという話をした。そしてそのためには、新規顧客CPAと購入転換率の最適なバランスを見つけることが重要であることを再度思い出してもらいたい。

この点を理解したうえで、パフォーマンスマーケティングにおいてデジタル広告のAIが具体的に何をしているのかというのをもう少し具体的に考えてみたい。

今回は、前回あげた例のうち、Free to Playのモバイルアプリのゲームの新規顧客獲得の事例で考えたい。今回、パフォーマンスマーケティングを開始するにあたって過去のゲーム内の課金者の実態を理解するためにデータ分析をしてみた。年代別の分析をした結果、下記の図のように登録CPAと購入者転換率に違いがあることが分かった。

当然新規獲得CPAは安い方が良いが、年代別に購入転換率に極端な違いがある。例えば、30代の購入転換率は15％だが、50代以上となると1％と15倍もの差がでている。この結果、購入者CPAを見ても20代の10,000円から50代以上の50,000円まで5倍もの差がある。ちなみに、この表からは読み取れないが、この4セグメント毎に投資した広告費をもとに加重平均すると購入者CPAは20,000円であったとする。

今回のプロジェクトでは、目標の購入者CPAは15,000円に改善することにしよう。

ひと昔前であれば、この状況でとにかく新規獲得者数をたくさん集めることに特化した結果、50代以上をたくさん取ってしまうリスクがあった。しかし、現代のパフォーマンスマーケティングの基本は登録数ではなく、購入者CPAの最適化を目指すということなので、その実現の方法論を探っていくことにする。

この事例の場合、パフォーマンスマーケティング的に実施可能なキャンペーンのデザインの仕方は、大きく分けて3つくらいのタイプに分かれる（理論上の話で、実際のメディア各社の商品構成上すべてができるかどうかは保証しない）。

年代毎に新規獲得CPAを設定して、新規獲得CPAで最適化する方法
年代ごとに価値の重みづけをして新規獲得CPAで最適化する方法
購入者CPAで最適化をする方法

年代毎に新規獲得CPAを設定して、新規獲得CPAで最適化する方法

まず、そもそも購入者CPAを15,000円に設定すると、購入者転換率がセグメントごとに一定だとすると実現したい新規獲得CPAは下記の表のようになる。

前の表と見比べてみると分かるが、20代と30代はそもそも購入者CPAの目標は甘くなるので、新規獲得CPAを現状よりも高く設定することが可能である。逆に40代以上は登録CPAの目標が大幅に低くなる。

このような時に、まず一番初めに考えるパフォーマンスのコントロールの方法は、広告運用の単位（キャンペーンとここでは呼ぶ）を年代ごとに切り分けで、各年代毎に目標新規獲得CPAを表に記載のCPAに設定して広告運用を行う方法である。キャンペーン毎の予算は広告主か手動で設定する。

では、この方法で広告の最適化を行うAIは何を行うのだろうか？一般的には、年代以外のどのような条件のユーザーにどのようなクリエイティブをどのタイミングで、いくらの単価で広告表示すると目標の新規獲得CPAで獲得出来るのかの調整をすることになる。

実際にはどのようなロジックでこの判定をしていくのかといえば、最初に広く広告を露出して、新規獲得に繋がったユーザーの実績を作る。そのユーザーの分析を行い、共通項を見つけ出す。ユーザー獲得に繋がりやすい広告クリエイティブ、広告露出のタイミング、広告露出の表示単価などである。次のステップとして、上記の実績をベースに導き出された新規獲得に繋がりやすそうな条件をベースに広告配信を強化し、それ以外の選択肢への広告配信を減らしていく。その結果、新規獲得への転換率が上がり、さらに確度の高い新規獲得のターゲットユーザー増が絞り込まれていく。

このプロセスを繰り返すことによって、ターゲットユーザー増や、そのターゲットごとの獲得率などのデータが蓄積されていくと、設定した新規獲得CPAでの獲得が安定してできるようになる。

この場合、広告主がAIに提供するデータは下記のようになる。

顧客の年齢層
キャンペーン毎の目標新規獲得CPA
キャンペーン事の広告予算
新規獲得の実績

AIはわずかこの4つの条件を設定されただけで、自社が活用可能な膨大なデータを活用して、年代ごとに指定した新規獲得CPAでユーザーを獲得するように最適化を図っていく。これだけでも相当に複雑な計算になるが、残念ながら、現実の広告運用からすると、最もシンプルな運用方法の例である。

では、この手法の広告運用が上手くいかないケースとはどのようなものが考えられるだろうか？

代表的な例は、AIが機械学習を行うのに必要な学習データの量が不足して、統計的に正しい分析が行えないケースである。

例えば、20代のキャンペーンの目標登録CPAは1,500円であるが、1週間の広告予算が15万円であったとする。そうすると100件程度の新規獲得実績が期待できる。一方1万5千円の予算であったらどうだろうか、10件程度の新規獲得実績となる。では、10件の実績から導き出される共通項と100件の実績から導き出される共通項ではどちらが信頼性が高いであろうか？当然100件である。機械学習というのは、学習の対象となるデータ量が多ければ多いほど正しい答えを導き出す可能性が高くなる。

この類似の事例としては、機械学習のAIが十分な学習期間を与えられずに正解を見つけるための試行錯誤をしている最中に上手くいかないと早く判断しすぎて、AIに出す獲得条件などの指示を変更してしまうような失敗パターンが考えられる。例えば、一時的に新規獲得CPAが大幅に上振れてしまい焦って広告予算額を縮小してしまうようなケースである。

ここまで読んでくるとなんとなく感じている方もいるかもしれないが、AIの機械学習の基本ロジックというのは、マーケティングの基本である「何時、誰に、何を伝えるか？」の膨大な組み合わせを、膨大なPDCAを回しながら見つけていくというプロセスを、人間の能力を圧倒的に上回る計算能力を駆使しておこなっているということである。その計算能力は人間の脳みそなど及びもつかないが、実はやっていることはとてもシンプルなのだと個人的には思っている。

まず、入門編として、機械学習のパフォーマンス広告の一番ベーシックなパターンを見てきたので、次は一段階進んだ事例を見てみよう。

年代ごとに価値の重みづけをして新規獲得CPAで最適化する方法

キャンペーン毎に適切な新規獲得CPAを設定して、決められた予算で各キャンペーンの獲得数を最大化する手法をベーシックなパターンとして見てきたが、この手法を少し高度化して考えてみよう。

この一つ目の手法には2つほど大きな問題点がある。一つ目は、失敗するパターンの代表例として説明したようにキャンペーンを細切れに分けることによって、キャンペーンあたりの学習母数が足りずに、最適化に十分な量の学習データが確保できないことがあるということである。２つ目の問題は、説明の中で実は重要なのであるが決まりごとのように深く言及しなかった項目なのだが、キャンペーン毎にいくらの広告予算の設定にすればよいのかをキャンペーンの構造の決定時に決めるロジックが乏しく、この部分をAIではなく、人間が所与の条件として決定しているということである。

この２つの問題を解決する方法が２つ目の方法である。この方法は、最初のキャンペーンの構成から2点を変更する。まず一つ目の学習母数を確保しやすくするために、年代ごとに4つのキャンペーンに分けていた構成を統合して1つのキャンペーンとしてしまう。この方法を取れば理論上はひとつのキャンペーンの学習母数は確保しやすくなるということになる。

二つ目の変更点は、年代層ごとに新規獲得の重みづけを行うことである。これは少し複雑なので、表を使って考えたい。

最初のキャンペーン構成で使った年代ごとの登録CPAの表に1列追加されている。「新規獲得相対価値」という項目である。学習母数を確保するためにキャンペーン構成を年代ごとに分けずに同じキャンペーンに統合してしまうことの最大の問題点は年代ごとの新規獲得CPAを個別に設定できないことである。その結果どのようなことが起きるかといえば、どんなに購買者転換率が低くても新規獲得CPAが安いものを優先してAIは獲得する方向で最適化してしまう。なぜなら、それが新規獲得CPAを改善させられるからである。しかし、それでは当然購入者CPAでの最適化にはなりにくい。

そこで、導入するのが年代毎の新規獲得者に対して相対的な価値の重みづけをするという手法である。そもそも、年代ごとの新規獲得CPAの目標値というのは、最終的な購入者CPA15,000円と年代ごとの購入転換率から逆算して計算されているため、新規獲得ユーザー毎の相対的な価値が金額に反映されている。表の例でいえば、購入者の価値を15,000円とした場合に、50代の新規ユーザーは150円程度の価値であり、20代の新規ユーザーは1,500円の価値があり、その差は10倍の差があるという分けである。このバージョンアップされた手法では、ユーザーの新規獲得時に登録フォームなどで年代を選択させ、登録完了した瞬間に年齢を判別して、このユーザーは150円の価値なのか、1,500円の価値なのかという情報をAIに提供し、10代のユーザーは50代のユーザーよりも10倍高い新規獲得CPAで取ってきても良いというメッセージを送ることで、価値の低いユーザーを大量に、目標値よりも高い単価で取ってきてしまうことを防ぐという方法である。

いかがだろうか？上手くいきそうであろうか？ぱっと聞いた感じだと、以前の手法に比べてそこまで複雑な運用をAIにお願いしているようにも思えないのではないだろうか。

（年代別キャンペーン）

顧客の年齢層
キャンペーン毎の目標新規獲得CPA
キャンペーン事の広告予算
新規獲得の実績

（年代ごとの価値の重みづけ型キャンペーン）

目標新規獲得CPA
年代ごとの新規登録者の価値の重みづけ
全体の広告予算
新規獲得実績

ところが、この手法は以前のキャンペーンから比較して、AIには相当複雑な計算を要求している。2つのキャンペーンにおいて、広告主がAIに与えているデータを比較して見よう。

追加したデータは価値の重みづけの項目ひとつであるが、2つの項目が似てはいるが変化している。一つ目は年代別キャンペーンでは年代ごとに新規獲得CPAを設定していたが、新キャンペーンでは全体の目標新規獲得CPAを1つ与えているのみである。キャンペーンがひとつしかないのであるから仕方がない。二つ目はこちらも人間が広告予算を年代別に決めてAIに指示を出していた前者と比較して、後者では全体の予算を1つ設定しているだけである。

この2つの違いは何を意味するのであろうか？簡単に言えば、年代別キャンペーンと比較して、AIはどの年代の顧客をどのような予算配分で獲得するのかという組み合わせを機械学習で計算するという仕事を追加でするということになる。と聞けば、そんなの最初のキャンペーンで人間が出来ているのであるから人間よりも計算能力が高いAIには簡単だと思う人が多いかもしれない。

しかし、これがなかなか上手くいかないことが多い。なぜなら、そもそも年代別のキャンペーンでも述べたように、以前のキャンペーンでも「何時、誰に、何を」の組み合わせは膨大なパターンがありそれをAIに計算させていいる状況であったが、それに、どの年代をどのくらいの比率で取るのが最適なのかというこれまた膨大なパターン分けの条件を追加している。全く適当な数字だが、例えば年代別のキャンペーンで百万通りの組み合わせから最適な組み合わせを選択していたとすると、それに2つの条件を組み合わせることで、さらに百倍とか千倍という量のパターンを追加で考えろと言っているわけである。それを実現するために人間が緩和した条件というのは、4つのキャンペーンをひとつに統合したくらいの話である。何百倍のパターンを追加で考えろといっているのに、人間が提供する学習機会の増加幅は多くて4倍程度なのである。

では人間にはなぜ簡単に出来ていそうなことがAIには難しいのであろうか？この辺はAIの専門家に聞いてみたいが、私の予想では、AIがバカ正直だからなのではないかと思う。前者のパターンで人間は他の条件は無視して、人間を勝手に10歳ごとの年齢層に区分けしてそれぞれの平均値を出して考えるというよく考えればなぜそうしているのかよくわからないシンプル化をして情報を整理している。しかし、そのシンプル化の仕方は、人間には見慣れた手法に感じるが、バカ正直にロジカルに考えるとその年齢別に分けるというシンプル化が理解できないのではないかと思う。なぜならおそらく31歳と39歳の差と39歳と40歳の人の差をWebの行動履歴などでみたら、おそらく後者の方が近しいタイプの人間に分類される可能性の方が高い気がするからだ。

但し、年代別キャンペーンよりもだいぶ複雑にはなるが、このキャンペーンの方が上手くいったときはより論理的で理想に近い形でユーザー獲得ができる可能性が高い。上手くいく方法はもちろん機械学習AIに十分な学習機会を提供することであるので、十分な予算と十分な成果量をキャンペーンごとに確保できるようにする必要がある。

購入者CPAで最適化する方法

三番目の方法は、AIに初めから購入者数を最大化するように指示を出し、購入者CPAを改善するという手法である。

具体的な説明をする前に、このパターンにおける広告主がAIに提供するデータの比較をしてみる。

（年代ごとの価値の重みづけ型キャンペーン）

目標新規獲得CPA
年代ごとの新規登録者の価値の重みづけ
全体の広告予算
新規獲得実績

（購入者CPA最適化）

目標購入者CPA
船体の広告予算
購入者獲得実績

提供しているデータは今までで一番少ない3つである。非常にシンプルである。価値重みづけキャンペーンの説明の中でAIの最適化の難易度は、条件が複雑になるほど最適化のハードルが高くなるという話をしたばかりなので、こちらの方がだいぶシンプルで上手くいきそうな気がする。

まず、この手法でやろうとしていることの説明からしよう。発想はシンプルで、購入者数を最大化したいのであれば、購入者数を最大化するようにAIに指示出しをすれば良いのではないかという話である。では、価値重みづけキャンペーンとこの手法との違いは何であろうか？価値重みづけ型キャンペーンの絶対的な前提条件は、年齢層別に購入者転換率が異なるということである。もちろん年代別の転換率の平均値を計算すれはその考え方は正しいように思える。しかし、多くの人が陥る罠であるが、平均値という考え方は実は実態と乖離があることが多い。

例えば20代の購入者転換率は10％であるが、これは単純に10人に一人の割合で購入者に転換するということを示しただけである。しかしこれは、10人中9人は購入者に転換しないことを意味する。つまり、圧倒的に非購入転換者の方を多く獲得していることを意味する。3つ目の方法は、この問題を解決するためには、年代ごとに区切って分析するという人間の脳みその限界値をカバーするために非合理的に決めた所与の条件を取っ払って、購入者に転換した人の共通点を純粋に見つけ出して、その人を集中的に獲得する方がより効率的に購入者数の増大を図れるのではないかという発想である。

凄く合理的で、正しい発想な気がしてくる。しかも、AIに提示する条件非常にシンプルであることも確認済みである。では、なぜこの手法が3番目に登場する最もアドバンスな手法なのであろうか？（是非、続きを読む前に予想してみてください。これまでの理解度が高ければ答えがわかるかも）。

一つ目の問題点は、単純に機械学習に必要な学習母数が飛躍的に少なくなるということである。今回の事例でいうと30代の購入者転換率が15％で最も高く、50代以上が1％で最も低いわけであるが、30代でも1/6、50代以上では1/100にまで学習データの量が減ってしまう。何度も申し上げているように、機械学習の成否を分けるポイントは、AIが十分に機械学習を行うために必要な学習機会を提供することである。この数が、大幅にへることは問題であることはほぼ間違いない。

そして2つ目の問題はタイムラグの問題である。今回はゲームアプリの例で話しているが、Free to Playのゲームにおいてユーザーがアプリをインストールしたタイミングと最初に課金するタイミングが同時に発生することはほぼ100％の確率であり得ない。それが数分のラグなのか、数日のラグなのか、数週間のラグなのかは別にして、同時なことはないといってよい。なぜなら、ゲーム内での課金は当然アプリをインストールし終わってからでないと出来ないからである。この問題はなにを意味するかというと、AIに広告の最適化のための学習機会となるユーザーの獲得成果の提供タイミングが遅くなるということを意味する。これが、数分とか数時間とかのラグであればそれほど問題がないような気がするが、これが数日とか数週間とかのラグであると問題はドンドン大きくなる。なぜなら、AIは今日行っている広告の最適化が上手くいっているのか上手くいっていないのかをリアルタイムで理解することが出来ずに、どの方向に進んでいけば良いのかが分からなくなってしまうからだ。

例えば、私の前職の人材紹介業というのは、求職者がサイトに登録してから実際に面接をして内定を受諾するまでに数カ月単位の時間がかかる。もしそれで内定受諾CPA最適化をしましょうという運用をしていると、AIは開始後数か月間は全く成果がないまま、たまたま、短期間で内定受諾した事例のみを頼りに正解を見つけることを続ける。ただし、短期間で内定受諾するひとが、全体として内定受諾するターゲットの特徴と一致していうかは不明だし、普通に考えるとずれている可能性が高い。とすれば、AIは学習機会が足りないだけでなく、ドンドン間違った方向に最適化をかけて行ってしまう可能性が高くなる。リードタイムが数カ月という例は、すこし極端なのかもしれないが、多くのビジネスで程度の差はあれ、同様の状況は発生することになる。

この問題を解決する方法として用いられる手法が、予測モデルを作るという手法である。具体的には、新規獲得をした段階で、そのユーザーがどの程度の確率で購入者に転換するのかリアルタイムで予測してAIに疑似的に購入者としてデータを提供するという手法である。これにより、AIは新規獲得と同じタイミングで購入者数のデータ（の予測値）を入手することが可能になり、タイムラグ問題を解決することが可能になる。

ただ、この手法を聞くと、頭の回転の早い人は、それってひとつ前の重みづけの条件を返しているのとやっていることはそんなに変わらないのでは？と思うかもしれない。その考えは正しい。この予測モデルというのは、人間が勝手に決めた年代別の平均購入者転換率をより精緻にするためにより複雑な統計モデルを組んで一人一人の新規獲得ユーザーの購入者転換率をリアルタイムで計算しようというもので、やろうとしていることの発想はほぼ変わらない。

つまり、この3番目のパターンの成功のカギは、購入者成果で最適化するという学習量の激減と購入転換予測モデルによる購入者転換率の改善幅で、後者の方が大きい場合に、価値重みづけ型の運用よりもパフォーマンスが良くなるということになる。

AIを上手にガイドする2つのポイント

ここまで見てきた3つのパターンが2024年現在で考えられるパフォーマンス広告の代表的な運用パターンの類型である。この3つのパターンの違いを理解したうえで、パフォーマンスマーケティングのAIを上手く使いこなすために広告運用者が考えなければいけないことを纏めてみたい。

まず、そもそもパフォーマンス広告のAIがやっていることというのは、「何時、誰に、何を伝えるか？」の膨大な組み合わせを、人間には到底不可能なパターンで検証して正解を見つけていくという、PDCAのスーパー高速回転であるということをが分かった。つまり、やろうとしていることは、量は多くても、発想は特別な事ではないということが分かる。

では、それを上手く実行するためには何が必要か？私が考える要素は①統計的に正しいレベルまでPDCAを回せるように十分な学習機会を提供する、②学習範囲を限定して機械学習が働きやすいようにするの2点である。

①については、最もシンプルな年代別キャンペーンからもっと高度な購入者CPA最適化へと運用手法を高度がしていく中で、十分な学習母数を確保できるかどうかの問題に直面し続けてきたので、皆さんもすぐに理解しやすいであろう。

②については、この話を逆の発想であるが、AIが説く問題の条件を増やし複雑化することで学習量の確保が必要なのであれば、問題の条件をシンプルにし検討事項を減らしてやることでAIが少ない学習量でも答えを見つけやすい環境を作ってあげようという話である。

これはおそらくパフォーマンス広告の運用に限らず、どのような機械学習系のAIを使うときも同じなのではないかと予想するが、AIを上手に使う上で、最も重要なことは、AIが説く問題の条件の複雑性と提供可能な機械学習量のバランスを適切に見極めることにあると思う。時代の流れや機械学習の理論的にはおそらく、人間は余計なことをせずに、データをひとつの箱に入れ、学習量を可能な限り確保して、後はAIに正解を見つけてもらう方が、AIよりも計算能力の低い人間が思い込みで考える仮説を前提とするよりも成果が高くなるという事なのだろうと思う。GoogleやMetaなど世界の最先端のAI技術を持つGlobal企業の商品設計のコンセプトや営業トークを聞いていると、時代の流れ的にはそのような発想なのだと思う。

ただ、2024年時点での私の見立てでは、現在デジタルマーケティングでちょっと頑張っている事業会社のマーケティングチームが活用可能な技術レベルでは、ギリギリそれなりの広告予算がある企業で価値の重みづけパターンを実現できるというのが実態で、予測モデルを用いた購入者CPA最適化のパターンを精緻に運用できる技術はまだまだ発展途上段階な気がする。まあ、私の身を置いていた環境のレベルが低すぎるという事であれば、是非向学のためにお話しさせていただく機会を頂戴したいと思う（ご連絡ください！）。

短くても7ー8年くらいの期間、AIが最適化するデジタル広告のプラットフォームと日々向き合いながら、どうやってAIと人間が上手に付き合い、人間がAIを使いこなすことが出来るかを考え続けてきた。AIの話をすると、AIというのは魔法の杖みたいなもので、人間がしてほしいことをすぐに実現してくれるものだと思ってしまうかもしれない。確かにChat GPTを一度体験してしまうとそう感じてしまうのも致し方ないと思う。

しかし、人間が非常に精緻に考え、PDCA繰り返し、練り上げてきたものよりもAIが精度高いものを即座に作り上げられるかといえば、私はまだそのレベルにまでは至っていないと思う。AIのパフォーマンスを最大限発揮させるためには、人間が正しくガイドしてあげることが必要なのだと思っている。