Introduction to Computational Advertising - Stanford大学資料から学ぶオンライン広告知識
Stanford大学オンライン広告授業
★★Stanford大学オンライン広告授業資料★★
機械学習/DB/人工知能の内容での授業公開で有名なStanford大学ですが、オンライン広告の授業資料も公開しています。一応私も広告配信、集計、解析に業務で携わっており、ようやく最近海外のオンライン広告のトレンドや論文の内容に注目し始めました。Standord大学オンライン広告の授業一覧と内容は次のようになっています。
- Overview and Introduction
- Marketplace and Economics
- Textual Advertising 1: Sponsored Search
- Textual Advertising 2: Contextual Advertising
- Display Advertising 1
- Display Advertising 2
- Targeting
- Recommender Systems
- Mobile, Video and other Emerging Formats
- Project Presentations
今日のブログでは第1回のOverview and Introductionについて日本語に訳しながら個人的に重要だと思う箇所だけ紹介します。みなさんからの反応が良ければ2回目以降の内容についても記述するかもです(笑) ちなみに授業のInstructorはYahoo!Incで研究者をやっているVanja Josifovski、Andrei_BroderAndrei Broderさんの二人です。
授業内容
(注) 以下ではcomputational” advertisingをオンライン広告と訳しています。本来の直訳はコンピュータによる広告です。
オンライン広告とは
- Find the "best match" between a given user in a given context and a suitable advertisement.(contextを与えられた条件のuserと最適な広告とのbest matchをみつけること)
- オンライン広告のマーケットは以下の3点の中心に位置する。
- Advertiser(広告主)
- Publisher(配信社、広告の出し面を作る人)
- User(ユーザ)
- オンライン広告(コンピュータ広告)の要素とは?
- 重要なメッセージ
- 繰り返しになるがオンライン広告とはユーザと広告のbestmatchを見つける事。
- 広告のお金的なスケールはとても大きい。
- 広告も情報の一つの形式である。
- 新しいアプリケーションやテクノロジーは日々開発されている。
なぜオンライン広告なのか?
- Computationalとつく学問は色々とあるが、これらの多くは以下の2つが言える。
- a) 古いコンピュータサイエンスとコンピュータの能力をMixしたもの。
- b) 昔の挑戦をアルゴリズム的に考えることである。
- 昔
- 広告媒体の関係性- 雑誌、新聞、テレビ等 複数存在していた。
- 一つの媒体に対してコストが高かった。
- パーソナライズ化されていない。
- Adの知識を持った人によるターゲティングだった
- ROI(投資に対するリターン)を測定するのが困難だった。
- 昔と比較してオンラインだと
- 機会は数十億以上
- クリエイティブも数十億以上
- パーソナライズ化可能
- 機会に対するコストが低い
- 定量化可能
- オンライン広告のメイン挑戦
- contextを与えられた条件のuserと最適な広告とのbest matchをみつけること。
- この場合のcontextが検索結果の場合はスポンサードサーチだし、配信者のページであればコンテンツマッチやバナー広告を示す。
- 同じような挑戦の例1として、
- メイン挑戦を分解してみると
- Representationとは効果的な方法の中でuserとcontextとadのを表現する事。
- Definitionとは現実的なマーケットとゴールを掴むための数学に最適化する問題を定義する事。
- Solutionとは有効な方法で最適化問題を解決する事。
- マーケットデザインはオンライン広告が支え、オンライン広告はシステムが支えている。
オンライン広告の機会
- 広告全体の出資費も増え続けるが、特にオンライン広告の出資費は2015年には2010年の2倍程となる予想。
- 広告の形式としては検索、ディスプレイ、属性配信が増えてきており、Email系は減少傾向にある。
- 誰が広告に出資しているかと言うと小売り業者、電話会社、金融サービス、コンピュータ製品、旅行関係、エンターテイメント系が増えている。
- アメリカの成人は有名な媒体を一日にどれぐらい何を使うかというと、1位:TV:4時間30分 40%、2位:インターネット:2時間30分 25%となっている。
- 半分以上の顧客がTV/Internetを利用している。
- 2011年のアメリカオンライン広告収益は1位:Google $12.77(billions)、2位:Yahoo! $3.46、3位:FaceBook $2.19、4位:Microsoft $1.92 、5位:AOL $0.85となっている。
- 何故オンラインにお金を費やすかというと
- 市場参加者はより測定可能な典型的広告と、効果的かつターゲティング可能な広告を安全に見る事が出来る。
- インターネットは昔からの全てのチャンネルより集計可能な媒体にしている。
- オンライン広告の価値
- 広告無しではWeb全体が縮小してしまう。
- 広告は顧客に対して直接的にも間接的にな多くの価値を創造する。
オンライン広告の背景
- 市場の原理
- CPM(Cost Per thousand impressions) = 1000インプレッション毎のコスト
- CPC(Cost Per Click) = クリック毎のコスト
- CPT/CPA(Cost Per Transaction/Action) = トランザクションやアクション毎のコスト
- グラフィカル広告
- グラフィカル広告にも配信数保証型(GD)とパフォーマンス型(NGD)がある。
- 配信数保証型(GD)
- ターゲティング属性のインプレッション(年齢、収入、地域性)を基に契約を結ぶ
- それぞれの契約には期間と希望配信数がある
- 配信保証型は価格の契約、トラフィック予想、有効な契約に対してインプレッションの割り振りをするなどの問題がある。
- パフォーマンス型(NGD)
- Representation
- Reactive ⇒ 広告はCTR/Page+重みづけにより配信。
- Predictive⇒ 広告の特性+重みづけにより配信。
- Hybrid⇒ ReactiveとPredictiveを連結。
テキスト型広告
広告の選択
- 問題の定義:広告の選定の目的
- それぞれの参加者は自身の有用性を望んでいる。
- 広告主はROIと量。
- ユーザは関連性。
- 配信者はインプレッションと検索毎の利益。
- Ad network事業者は収益と成長 - 広告の選択:これら4つの参加者の有用性の均衡がとれる場所がゴールとするための最適化。
- いくつかのトレードオフはビジネス目的の短い単語と長い単語を関連付けさせる。
- 目的の中での定期的な変更に基づく簡単な調整を許可する。
- 効果として要求されること:スケールとサービスのコスト - 10億規模:
- sponsored searchとcontent matchにおける10億の広告。
- 10億もの一意な検索ワード/一時間毎の100万検索。
- 1兆のインプレッション(content macthとグラフィカル広告の両方で)
- 10億のユーザ。
- ミリ秒
- レスポンスタイムが100msを超えてはいけない。
- お金:
- リクエストは処理におけるCPUの使用量を必要とする。
- データはメモリーに納まりきるように。
- リクエスト毎のコストはサービスのコストより低くする必要がある。
- 低いCTRはチャレンジングな問題とする。
テキスト広告の選択
- 始め:データベースのアプローチ
- sponsored searchのデータベース問題について考える。
- SELECT ads FROM ad_table WHERE bid_phrase = query
- 実装
- Sponsored search
- 入札されたphrase(標準化された形式)の広告にマッチするquery。
- 広告主は全ての柔軟なqueryを入札する事ができない。(特に末尾)→さらに進化したmatchが亜必要。
- 進化したmatch→入札されたphraseに対してqueryを変換
- contextや関連性などを把握するのはとても難しい。
- 価格は間違ったleadをする。- オリジナルのphraseはAdvanced Matchとほとんど関係がない。
- Content Match → ページ上の入札Phase
- contextや意味,関連性を把握する事は難しい。
- 広告のデータスキーマ
- 広告主 - アカウント - キャンペーン - AdGroup - Creatives : 入札Phraseなどのような階層構造で定義する。
- 入札Phraseは1つでも1000でも可能。
- 古くからの概念:情報としての広告
- "広告をエンターテイメントや芸術の形式として考えてはいないが、メディアの情報としては別である" [David Ogilvy, 1985]
- "広告は情報である" [Nelson, 1974]
- 関係のない広告は迷惑。関係のある広告は興味がある。
- 最適なテキスト広告を見つける事は情報検索の問題である。(多様かつ多くの便利な機能に矛盾してしまう)
- 最適な広告を見つけるための情報検索(IR)問題
- Representation: IRの中では広告をドキュメントとして扱う。 [Ribeiro-Neto et al. SIGIR 2005] [Broder et al. SIGIR2007] [Broder et al.
CIKM2008]
- 広告検索の問題を定義
- 広告コーパスは以下である。
- テキスト形式 : 入札Phase(s) + Title + Createive + URL + 掲載ページ + ...
- グラフィカル形式: 広告主から与えられるmeta data + URL + 掲載ページ + クリックがあるページのコンテンツ ...
- queryの特性は以下である。
- Keyword検索 + 知識拡張の外 + contextの特性。
- sponsored searchのcontextの特性は以下である
- 場所 + ユーザのデータ + 以前の検索内容 + ...
- content matchのcontextの特性は以下である
- 場所 + ユーザのデータ + ページのトピックス + ページのキーワード。
まとめ
- key messages
- 1. オンライン広告 = ユーザと最適な広告の間のbest matchを見つけることが基本的な方法。
- 2. 副問題のkey
- 1 ユーザ、context、広告の表現
- 2 最適化問題の精度
- 3 効率的、効果的な解決
- 3. オンライン広告の経済的なスケールは巨大である。
- 小さな定数の問題。
- 多量の更なるリサーチが期待出る。
- 4.広告は情報形式の一つ
- contextに対して広告を入れる事は異なるタイプの情報を集約する事と同じである。
- 最適な広告を見つける事は情報検索問題の1つである。(多様かつ多くの便利な機能に矛盾してしまう)
- 5.新しいアプリケーションや技術は毎日出てきている。
- 研究領域 + 新しいビジネスは良い!
以上で終わりです。