読者です 読者をやめる 読者になる 読者になる

Web就活日記

愛と夢と人生について書きます

Introduction to Computational Advertising - Stanford大学資料から学ぶオンライン広告知識

Stanford大学オンライン広告授業

★★Stanford大学オンライン広告授業資料★★
機械学習/DB/人工知能の内容での授業公開で有名なStanford大学ですが、オンライン広告の授業資料も公開しています。一応私も広告配信、集計、解析に業務で携わっており、ようやく最近海外のオンライン広告のトレンドや論文の内容に注目し始めました。Standord大学オンライン広告の授業一覧と内容は次のようになっています。

  1. Overview and Introduction
  2. Marketplace and Economics
  3. Textual Advertising 1: Sponsored Search
  4. Textual Advertising 2: Contextual Advertising
  5. Display Advertising 1
  6. Display Advertising 2
  7. Targeting
  8. Recommender Systems
  9. Mobile, Video and other Emerging Formats
  10. Project Presentations

今日のブログでは第1回のOverview and Introductionについて日本語に訳しながら個人的に重要だと思う箇所だけ紹介します。みなさんからの反応が良ければ2回目以降の内容についても記述するかもです(笑) ちなみに授業のInstructorはYahoo!Incで研究者をやっているVanja JosifovskiAndrei_BroderAndrei Broderさんの二人です。

授業内容

(注) 以下ではcomputational” advertisingをオンライン広告と訳しています。本来の直訳はコンピュータによる広告です。

オンライン広告とは
  • Find the "best match" between a given user in a given context and a suitable advertisement.(contextを与えられた条件のuserと最適な広告とのbest matchをみつけること)
  • オンライン広告のマーケットは以下の3点の中心に位置する。
    • Advertiser(広告主)
    • Publisher(配信社、広告の出し面を作る人)
    • User(ユーザ)
  • オンライン広告(コンピュータ広告)の要素とは?
  • 重要なメッセージ
    • 繰り返しになるがオンライン広告とはユーザと広告のbestmatchを見つける事。
    • 広告のお金的なスケールはとても大きい。
    • 広告も情報の一つの形式である。
    • 新しいアプリケーションやテクノロジーは日々開発されている。
なぜオンライン広告なのか?
  • Computationalとつく学問は色々とあるが、これらの多くは以下の2つが言える。
    • 広告媒体の関係性- 雑誌、新聞、テレビ等 複数存在していた。
    • 一つの媒体に対してコストが高かった。
    • パーソナライズ化されていない。
    • Adの知識を持った人によるターゲティングだった
    • ROI(投資に対するリターン)を測定するのが困難だった。
  • 昔と比較してオンラインだと
    • 機会は数十億以上
    • クリエイティブも数十億以上
    • パーソナライズ化可能
    • 機会に対するコストが低い
    • 定量化可能
  • オンライン広告のメイン挑戦
    • contextを与えられた条件のuserと最適な広告とのbest matchをみつけること。
    • この場合のcontextが検索結果の場合はスポンサードサーチだし、配信者のページであればコンテンツマッチやバナー広告を示す。
    • 同じような挑戦の例1として、
  • メイン挑戦を分解してみると
    • Representationとは効果的な方法の中でuserとcontextとadのを表現する事。
    • Definitionとは現実的なマーケットとゴールを掴むための数学に最適化する問題を定義する事。
    • Solutionとは有効な方法で最適化問題を解決する事。
  • マーケットデザインはオンライン広告が支え、オンライン広告はシステムが支えている。
オンライン広告の機会
  • 広告全体の出資費も増え続けるが、特にオンライン広告の出資費は2015年には2010年の2倍程となる予想。
  • 広告の形式としては検索、ディスプレイ、属性配信が増えてきており、Email系は減少傾向にある。
  • 誰が広告に出資しているかと言うと小売り業者、電話会社、金融サービス、コンピュータ製品、旅行関係、エンターテイメント系が増えている。
  • アメリカの成人は有名な媒体を一日にどれぐらい何を使うかというと、1位:TV:4時間30分 40%、2位:インターネット:2時間30分 25%となっている。
  • 半分以上の顧客がTV/Internetを利用している。
  • 2011年のアメリカオンライン広告収益は1位:Google $12.77(billions)、2位:Yahoo! $3.46、3位:FaceBook $2.19、4位:Microsoft $1.92 、5位:AOL $0.85となっている。
  • 何故オンラインにお金を費やすかというと
    • 市場参加者はより測定可能な典型的広告と、効果的かつターゲティング可能な広告を安全に見る事が出来る。
    • インターネットは昔からの全てのチャンネルより集計可能な媒体にしている。
  • オンライン広告の価値
    • 配信者の収益は拡大するし、小さな配信者もやって行けるようになる。
    • 広告のリーチに焦点が当てられ、ニッチな興味のビジネスも可能とする。
    • 広告主の利益もFreeサービスを使って(Facebook,google,twitter,yahooなど)拡大する。
  • 広告無しではWeb全体が縮小してしまう。
    • 広告は顧客に対して直接的にも間接的にな多くの価値を創造する。
オンライン広告の背景
  • 市場の原理
  • CPM(Cost Per thousand impressions) = 1000インプレッション毎のコスト
  • CPC(Cost Per Click) = クリック毎のコスト
  • CPT/CPA(Cost Per Transaction/Action) = トランザクションやアクション毎のコスト
  • グラフィカル広告
    • グラフィカル広告にも配信数保証型(GD)とパフォーマンス型(NGD)がある。
  • 配信数保証型(GD)
    • ターゲティング属性のインプレッション(年齢、収入、地域性)を基に契約を結ぶ
    • それぞれの契約には期間と希望配信数がある
    • 配信保証型は価格の契約、トラフィック予想、有効な契約に対してインプレッションの割り振りをするなどの問題がある。
  • パフォーマンス型(NGD)
    • グラフィカル広告はCPM/CPC/CPAなどのパフォーマンスを基にされる。
    • 一時的に最適化問題の精度 = クリックレート(CTR)のMaxと仮定する
    • マッチングのアプローチ
      • Reactive:異なるページの広告を閲覧、それぞれのページのCTRは達成される、CTRを学習するとCTRが最大となる広告を選ぶことができる。
      • Predictive: 関連のある広告を用いる為に特性を生成する事、ランディングページを作る事、広告主がメタデータを作る事。- ページや広告の特性に基づくパフォーマンスを予測する事。
      • Hybrid: ReactiveとPredictiveを重ね合わせたもの。
  • Representation
    • Reactive ⇒ 広告はCTR/Page+重みづけにより配信。
    • Predictive⇒ 広告の特性+重みづけにより配信。
    • Hybrid⇒ ReactiveとPredictiveを連結。
テキスト型広告
  • 1.検索keywordから導き出される広告=Sponsored Search
    • adwordsなど。
    • 広告主はPhase(Query)を入札する。
  • 2.webページのコンテンツから導き出される広告=Content Match
  • 歴史
    • 1990年後半にAlta VistaがSponsored Search Modelに挑戦した。
    • Goto.com(のちにOvertureに吸収)が広告配信の検索エンジンを開発。
      • 商業に興味のあるユーザはこのエンジンに興味を持った。
      • ピーク時には10億ドル規模のビジネスに。
    • GoogleがSponsored Search modelに再度挑戦。
      • この時は成功した。
    • 広告主は十分な効果を受けることができない。
      • Content Matchはよりインプレッションを提供することが可能
広告の選択
  • 問題の定義:広告の選定の目的
    • それぞれの参加者は自身の有用性を望んでいる。
  1. 広告主はROIと量。
  2. ユーザは関連性。
  3. 配信者はインプレッションと検索毎の利益。
  4. Ad network事業者は収益と成長 - 広告の選択:これら4つの参加者の有用性の均衡がとれる場所がゴールとするための最適化。
  • いくつかのトレードオフはビジネス目的の短い単語と長い単語を関連付けさせる。
  • 目的の中での定期的な変更に基づく簡単な調整を許可する。
  • 効果として要求されること:スケールとサービスのコスト - 10億規模:
    • sponsored searchとcontent matchにおける10億の広告。
    • 10億もの一意な検索ワード/一時間毎の100万検索。
    • 1兆のインプレッション(content macthとグラフィカル広告の両方で)
    • 10億のユーザ。
  • ミリ秒
    • レスポンスタイムが100msを超えてはいけない。
  • お金:
    • リクエストは処理におけるCPUの使用量を必要とする。
    • データはメモリーに納まりきるように。
    • リクエスト毎のコストはサービスのコストより低くする必要がある。
    • 低いCTRはチャレンジングな問題とする。
テキスト広告の選択
  • 始め:データベースのアプローチ
    • sponsored searchのデータベース問題について考える。
      • SELECT ads FROM ad_table WHERE bid_phrase = query
    • 実装
      • Sponsored search
        • 入札されたphrase(標準化された形式)の広告にマッチするquery。
        • 広告主は全ての柔軟なqueryを入札する事ができない。(特に末尾)→さらに進化したmatchが亜必要。
      • 進化したmatch→入札されたphraseに対してqueryを変換
        • contextや関連性などを把握するのはとても難しい。
        • 価格は間違ったleadをする。- オリジナルのphraseはAdvanced Matchとほとんど関係がない。
      • Content Match → ページ上の入札Phase
        • contextや意味,関連性を把握する事は難しい。
  • 広告のデータスキーマ
    • 広告主 - アカウント - キャンペーン - AdGroup - Creatives : 入札Phraseなどのような階層構造で定義する。
    • 入札Phraseは1つでも1000でも可能。
  • 古くからの概念:情報としての広告
    • "広告をエンターテイメントや芸術の形式として考えてはいないが、メディアの情報としては別である" [David Ogilvy, 1985]
    • "広告は情報である" [Nelson, 1974]
    • 関係のない広告は迷惑。関係のある広告は興味がある。
    • 最適なテキスト広告を見つける事は情報検索の問題である。(多様かつ多くの便利な機能に矛盾してしまう)
  • 最適な広告を見つけるための情報検索(IR)問題
    • Representation: IRの中では広告をドキュメントとして扱う。 [Ribeiro-Neto et al. SIGIR 2005] [Broder et al. SIGIR2007] [Broder et al.

CIKM2008]

    • Optimization/solution: 広告のコーパスからqueryの評価を行う事によって広告を検索する。
    • 詳細は以下のように
      • queryを解析したり、query特性を引き出す。query = full context(コンテンツ、ユーザのプロフィール、環境など)
      • ドキュメント(広告)を解析したり、ドキュメントの特性を引き出す。
      • 得点機能を工夫する = queryやdocumentの特性と重み付けを予測する。
      • 最大の得点機能をもったアドの引き当てを速く行う事が可能な検索エンジンを開発する。
  • 広告検索の問題を定義
    • 広告コーパスは以下である。
      • テキスト形式 : 入札Phase(s) + Title + Createive + URL + 掲載ページ + ...
      • グラフィカル形式: 広告主から与えられるmeta data + URL + 掲載ページ + クリックがあるページのコンテンツ ...
    • queryの特性は以下である。
      • Keyword検索 + 知識拡張の外 + contextの特性。
    • sponsored searchのcontextの特性は以下である
      • 場所 + ユーザのデータ + 以前の検索内容 + ...
    • content matchのcontextの特性は以下である
      • 場所 + ユーザのデータ + ページのトピックス + ページのキーワード。
まとめ
  • key messages
    • 1. オンライン広告 = ユーザと最適な広告の間のbest matchを見つけることが基本的な方法。
    • 2. 副問題のkey
      • 1 ユーザ、context、広告の表現
      • 2 最適化問題の精度
      • 3 効率的、効果的な解決
    • 3. オンライン広告の経済的なスケールは巨大である。
      • 小さな定数の問題。
      • 多量の更なるリサーチが期待出る。
    • 4.広告は情報形式の一つ
      • contextに対して広告を入れる事は異なるタイプの情報を集約する事と同じである。
      • 最適な広告を見つける事は情報検索問題の1つである。(多様かつ多くの便利な機能に矛盾してしまう)
    • 5.新しいアプリケーションや技術は毎日出てきている。
      • 研究領域 + 新しいビジネスは良い!

以上で終わりです。

スポンサーリンク