広告運用者のための
文章を「座標」に変換して、勝ちCRを数字で見つける
← → キーまたは右下のボタンで進む
勝ちCRを人間の感覚で判断している
「なんかこのフック刺さりそう」
「前に似たのが当たった気がする」
勝ちCRかどうかを数字で判定したい
「この台本は勝ちパターンから
距離 0.12 → かなり近い」
そのために必要なのが ベクトル化
東京と大阪の「場所」は
2つの数字で表せる
東京 = (35.68, 139.77)
大阪 = (34.70, 135.50)
2つの座標があれば
距離を計算できる
→ 約400km
| 地図 | ベクトル化 | |
|---|---|---|
| 対象 | 場所 | 文章の「意味」 |
| 座標の数 | 2個(緯度・経度) | 3,072個 |
| 人間が見える? | 見える | 見えない(AIが計算) |
| 距離の計算 | km | コサイン類似度(0〜1) |
1つの台本が、こんな数字の列に変換される
↑ 実際のベクトルの一部(3,072個中の最初の60個)
地図が2次元で
「場所」を表すように
3,072次元で
「文章の意味」を表す
人間には想像できないけど、AIは計算できる
エンジンの仕組み
Geminiは数十億の文章を読んで、
「どの言葉がどの言葉の近くに出るか」を学習している
「おはよう」の近くによく出る言葉:
朝、起きる、元気、今日、ございます
「さようなら」の近くによく出る言葉:
帰る、別れ、また、明日、お元気で
各数字は「意味のある方向」を表す
ある軸: 「朝っぽさ」の強さ
別の軸: 「挨拶っぽさ」の強さ
また別の軸: 「別れっぽさ」の強さ
...×3,072個
※実際の軸は人間には名前をつけられない
抽象的なもの。上はイメージ
つまり各数字は「この文章は、この意味の方向にどれだけ強いか」を表している
3,072個のうち、わかりやすい「軸」をイメージで見る
「挨拶っぽさ」が両方高い → だから類似度 0.74
「朝っぽさ」と「別れっぽさ」が逆 → だから1.0にはならない
※この軸名はイメージ。実際の3,072軸は人間が名前をつけられない抽象的なもの
前ページの5軸を使って計算してみる
各軸のペアを掛け算する:
1.57 = おはようの矢印の長さ(1.22) × さようならの矢印の長さ(1.29)
※ 5軸だけの例。3,072軸すべてで計算すると → 0.742
両方高い軸(挨拶っぽさ)の掛け算が大きい
→ 合計を引き上げる → 類似度が高くなる
÷ 矢印の長さ = 0〜1に正規化
→ 文が長くても短くても同じ基準で比較
距離じゃなくてコサイン(角度)を使う理由
「おはよう」と
「おはよう!今日も元気に頑張ろう!おはよう!」
→ 文章の長さが違うだけで
距離が離れてしまう
意味が同じなら矢印の向きが同じ
文章が長くても短くても、向きは変わらない
→ 「何を言ってるか」だけで判定できる
そう、サイン・コサイン・タンジェントの
あのコサイン。
三角形の辺の比率 → cos θ
2本の矢印の「角度」を測る
角度が小さい = 意味が近い
角度 0° → cos = 1.0(完全に同じ)
角度 40° → cos = 0.77(似てる)
角度 90° → cos = 0.0(無関係)
実際にGemini APIでベクトル化した結果(本物のデータ)
ほぼ同じ意味
同じ「挨拶」カテゴリ
同じ「転職」トピック
全く違うジャンル
| 関係性 | 例 | 類似度 | AIの理解 |
|---|---|---|---|
| ほぼ同義 | おはよう ↔ おはようございます | 0.87 | 丁寧さが違うだけ |
| 同カテゴリ | おはよう ↔ さようなら | 0.74 | どっちも「挨拶」 |
| 同トピック | 転職で年収UP ↔ 事務職500万 | 0.75 | どっちも「転職×年収」 |
| 無関係 | おはよう ↔ 転職したい | 0.56 | 全く関係ない |
つまりAIは「おはよう」と「さようなら」が
違う言葉だけど同じカテゴリ(挨拶)であることを
数字だけで理解している
これと同じことが、広告の台本でもできる
全部の結果を数直線に並べると
0.4
SQL vs 桃太郎(長文)
0.49
0.51
SQL vs 君が代(短文)
桃太郎 vs ハリポタ(あらすじ)
0.59
0.74
おはよう vs さようなら
勝ちCR vs 負けCR
0.78
0.87
おはよう vs おはようございます
1.0
0.5未満 = ジャンル違い+長さの差が大きい 0.5台 = ジャンルが違う 0.7台 = 同カテゴリ 0.8台以上 = ほぼ同じ意味
Gemini Embedding API で実際のCR台本を比較
おはよう vs さようなら(0.74)と同じ感覚
→ 同じ「転職CR」だけど、中身の違いを検出できている
勝ちCRを10本ベクトル化すると
地図上にピンが集まる
DProの売れてるCR 10本の
ベクトルが集まるエリア
不調CRのベクトルが
集まるエリア
誰もいないエリア
→ 新規性があるかも?
距離が近い = 勝ちパターンに似ている
距離が遠い = 勝ちパターンから外れている
💰
コスト: 数十本で数円
Gemini Embedding API
⚡
速度: 1秒以下
リアルタイム判定
🎯
精度: データ量で向上
勝ちCRが増えるほど精度UP
使うときに忘れちゃいけない3つのこと
半年前の勝ちCRは今の勝ちCRじゃない。
→ 直近1〜2ヶ月の勝ちCRに重みをつける必要がある。
勝ちゾーンに密集しすぎると、視聴者が見慣れて見飽きる。
→ 競合も同じゾーンに集まってくるから、むしろ少しずらした方が勝てる可能性がある。
→ ピンが全く立ってないエリアに新規性があることも。
台本の文字だけでは判断できない。UGC/ニュース風/実写…動画の「型」も勝敗を分ける。
→ テキストベクトル + フォーマット分類の組み合わせが必要。
① ベクトル化 = 文章を数千個の数字(座標)に変換すること
② コサイン類似度 = 2本の矢印の角度で「意味の距離」を測る(三角関数のコサイン)
③ スケール感 = 0.5台(無関係)→ 0.7台(同カテゴリ)→ 0.8以上(ほぼ同じ)
④ 勝ちゾーン = 勝ちCRのベクトルが集まるエリア。新台本との距離を測る
⑤ 注意 = 時間軸・競合コピー・動画フォーマットは別で考慮が必要
次のステップ: DProから勝ちCRを10本集めて「勝ちゾーン」を作る