news 2026/2/7 7:15:10

计算广告:智能时代的营销科学与实践(四)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
计算广告:智能时代的营销科学与实践(四)

目录

2.2 互联网广告的技术特点

一、可衡量性(Measurability):从“迷雾”到“显微镜”

1. 测量维度的革命

2. 从“衡量结果”到“优化过程”

二、可定向性(Targetability):从“广播”到“狙击”

1. 定向技术的演进谱系

2. 技术实现:标签系统与实时决策

三、可交互性(Interactivity):从“诉说”到“对话”

1. 交互层次的深化

2. 技术支撑

四、可程序化(Programmability):从“手工”到“自动化”的产业重塑

1. 核心:实时竞价(RTB)

2. 自动化与智能化的外延

总结:四大特点的合力与未来

2.3 计算广告的核心问题

一、核心问题的多维度解构

2.3.1 广告收入的分解

1. 单次广告展示的价值链条

2. 不同市场结构下的收入分解

3. 收入分解的产业意义

2.3.2 结算方式与eCPM估计的关系

1. 结算方式的“全家福”

2. eCPM:统一的“价值度量衡”

3. 结算方式、eCPM与三方博弈的精妙平衡

4. 从我的实践视角看:eCPM估计的演进与挑战


2.2 互联网广告的技术特点

当我们从原理层面理解了广告何以有效,一个随之而来的问题便是:这种有效性,如何在互联网这一特定介质上被系统地实现、放大和优化?互联网并非简单的“另一个媒体渠道”,它是一套全新的技术基础设施。这套设施赋予广告一系列传统媒体无法企及的革命性特点,正是这些特点,使得“计算广告”从概念变为现实,并催生出一个庞大的技术驱动型产业。

本节将深入剖析互联网广告区别于传统广告的四大核心技术特点:可衡量性、可定向性、可交互性与可程序化。这四大特点并非彼此孤立,而是层层递进、相互增强,共同构成了现代在线广告系统的技术基石。理解它们,是理解所有后续产品、技术和商业逻辑的钥匙。

一、可衡量性(Measurability):从“迷雾”到“显微镜”

传统广告效果衡量如同在迷雾中估测距离,而互联网广告的衡量则像是在显微镜下观察细胞。其核心在于,数字世界的每一次用户与广告的接触,都能以日志的形式被精确记录,形成一个完整、闭环的数据反馈系统。

1. 测量维度的革命
  • 曝光(Impression):广告被下载并展示在用户设备上的次数。这是最基础的计量单位,对应传统媒体的“发行量”或“收视率”,但更精确。

  • 点击(Click):用户主动与广告互动的行为。这是数字广告独有的、革命性的指标,它标志着用户从“被动接收”进入“主动探索”阶段。点击率(CTR)成为衡量广告吸引力和相关性的黄金指标。

  • 转化(Conversion):用户点击后完成的具有商业价值的特定行为,如下载、注册、购买、留资等。转化率(CVR)直接连接了广告支出与商业回报。

  • 后续行为(Post-Conversion):转化后的用户活跃度、复购率、生命周期价值(LTV)等。这衡量了广告带来的用户质量。

“可衡量性”的实现,依赖于一整套技术栈:

  • 前端监测代码(Tracking Pixel/SDK):嵌入在网页或APP中,在广告展示、点击或应用内关键行为发生时,向广告服务器的日志系统发送一条记录。

  • 广告服务器(Ad Server):不仅是投放引擎,也是中央化的数据记录仪,统一记录所有曝露、点击数据。

  • 归因分析平台:将分散在不同渠道、不同时间的用户接触点与最终转化串联起来,解决“功劳归谁”的问题。

2. 从“衡量结果”到“优化过程”

可衡量性的真正威力,不在于事后报告,而在于实时反馈与在线优化

  • A/B测试成为常态:可以同时在线测试两个不同的创意、两个不同的出价策略或两个不同的人群定向,并依据实时数据(如CTR)快速决定优胜者。

  • 动态出价:基于对当前流量实时预估的CTR和CVR,动态调整每次竞价的出价,实现“不同的人,不同的价”。

  • 预算自动化分配:系统可以实时监控各渠道、各广告计划的转化成本和ROI,自动将预算从效果差的计划调往效果好的计划。

挑战与演进:

  • 归因难题:跨设备、跨渠道的归因仍是技术挑战。苹果的SKAdNetwork等隐私框架引入了数据延迟和聚合,给实时优化带来困难。

  • 衡量欺诈:虚假流量(Bot Traffic)、点击欺诈等一直与可衡量性如影随形,催生了庞大的反作弊技术产业。

  • 从“最后点击”到“全触点衡量”:行业正从简单粗暴的“最后点击归因”向更科学的“数据驱动归因(DDA)”演进,以更公平地衡量品牌曝光等非直接转化类广告的价值。

从我的实践视角看,在雅虎和MediaV的早期,我们花大力气建立的可信、统一的监测体系,是赢得广告主信任的基石。在360,由于我们同时拥有媒体(浏览器、安全产品)和广告平台(DSP)角色,我们深刻体会到“围墙花园”内外衡量标准的割裂。花园内(如Facebook)的数据闭环且完整,但对外不透明;花园外的开放网络则需要依赖可能被拦截或失真的第三方监测代码。这种割裂今天依然是行业痛点。

二、可定向性(Targetability):从“广播”到“狙击”

如果说可衡量性解决了“效果如何”的问题,可定向性则解决了“给谁看”的问题。它指的是将特定广告投放给特定人群的能力,其精度从模糊的人口统计区间,一直可以提升到个体级别。这是互联网广告精准化的核心。

1. 定向技术的演进谱系

定向能力的发展,是一部数据利用深度不断进化的历史:

  • 上下文定向(Contextual Targeting):根据广告所在页面的内容来投放相关广告(例如,在体育新闻页面投放运动鞋广告)。技术基础是自然语言处理(NLP)和主题分类。

  • 地域定向(Geographic Targeting):基于用户IP地址或GPS位置。

  • 人口属性定向(Demographic Targeting):推测用户的年龄、性别、收入等。早期通过注册信息,如今更多通过机器学习模型基于行为数据预测。

  • 行为定向(Behavioral Targeting):定向技术的飞跃。通过分析用户长期的历史浏览、搜索、购买等行为,构建兴趣标签体系(例如,“数码爱好者”、“备孕妈妈”)。这是程序化广告的基石。

  • 意图定向(Intent Targeting):捕捉用户当下的实时意图,最典型的是搜索关键词。这是转化率最高的定向方式。

  • 人群扩展(Look-alike Modeling):定向技术的集大成者。给定一小群种子用户(如高价值客户),通过机器学习算法在全网寻找与其特征相似的潜在用户。它实现了定向从“规则定义”到“模型发现”的升级。

图2-2:广告定向技术演进与数据深度关系图
(此处可配图:一个从左到右的箭头,标示“数据利用深度”增加。从左至右排列:上下文定向(利用页面数据)、地域定向(利用位置数据)、人口属性定向(利用推测数据)、行为定向(利用历史行为数据)、意图定向(利用实时行为数据)、人群扩展(利用种子用户+全网行为数据)。)

2. 技术实现:标签系统与实时决策
  • 标签体系(Tagging System):是定向的“语言”。一个结构化的、可扩展的标签分类体系(Taxonomy)是基础。标签可以是预先定义的(如行业分类),也可以是算法实时挖掘的(如动态兴趣点)。

  • 实时用户画像(Real-time User Profile):系统需要将分散在多个数据源的用户行为,在毫秒级内汇聚成统一的、可用于定向的画像。这依赖于高性能的键值存储(如Redis)和实时流处理技术。

  • 定向逻辑服务器(Targeting Logic Server):在广告检索时,快速判断请求中的用户ID是否命中广告主设置的复杂定向条件组合(如“北京且男性且(爱好汽车或科技)且最近7天搜索过‘新能源车’”)。

挑战与演进:

  • 隐私之殇:基于跨站追踪的行为定向,是当前隐私监管打击的核心。第三方Cookie和移动设备ID的消亡,正在迫使行业寻找新范式。

  • 数据孤岛:用户数据分散在各个“围墙花园”内,难以形成跨平台的统一视图。

  • 解决方案探索:联邦学习、差分隐私、基于第一方数据的协作(如Clean Room),以及谷歌倡导的基于兴趣群体(Topics API)的隐私沙盒方案,都是试图在保护隐私前提下保留一定定向能力的技术尝试。

三、可交互性(Interactivity):从“诉说”到“对话”

互联网广告不是一幅静止的平面海报或一段单向的电视广告。它允许,甚至鼓励用户实时参与和互动,这彻底改变了广告沟通的模式。

1. 交互层次的深化
  • 点击(Click):最基本的交互,将用户从曝光场景带至落地页,开启深度沟通。

  • 富媒体交互(Rich Media Interaction):广告单元本身即可包含视频播放、360度产品旋转、迷你游戏、表单填写等,用户无需离开当前页面即可完成深度互动,极大提升体验和转化效率。

  • 社交互动(Social Engagement):点赞、评论、分享。广告成为社交话题的起点,其传播力被指数级放大。

  • 直接行动(Direct Action):在广告单元内直接完成核心操作,如一键预约、一键加购、一键下载。这得益于移动生态的完善(如微信小程序),将转化路径缩短到极致。

2. 技术支撑
  • HTML5与WebGL:使得在浏览器内创建复杂的交互式广告成为可能,无需插件。

  • 小程序与快应用:提供接近原生APP的体验,且即点即用,是“直接行动”型广告的理想载体。

  • 增强现实(AR)广告:用户可通过摄像头“试用”产品(如试戴眼镜、试摆家具),互动性和体验感极强。

可交互性的意义在于,它将广告从“成本中心”(需要额外的落地页成本)部分转变为“体验中心”甚至“销售终端”,直接创造了价值。

四、可程序化(Programmability):从“手工”到“自动化”的产业重塑

这是互联网广告最本质、也是最具颠覆性的技术特点。它意味着广告的购买、售卖、投放和优化全过程,可以通过软件和算法自动执行,无需人工逐笔谈判和操作。它催生了“程序化交易”这一全新产业。

1. 核心:实时竞价(RTB)

RTB是可程序化的巅峰体现。它将每一次广告展示机会,都变成了一次在公开市场或私有市场上的实时、自动化拍卖

  • 流程(在<100毫秒内完成):

    1. 用户访问媒体页面。

    2. 媒体SSP向ADX发送广告请求,附带用户匿名ID。

    3. ADX向多家DSP发送竞价请求(Bid Request)。

    4. 各DSP的算法基于用户数据、上下文等,在毫秒内决定是否出价及出价多少。

    5. 出价最高的DSP赢得展示,其广告创意被返回并展示给用户。

    6. 竞价结果、后续点击/转化数据通过日志返回各方,用于模型优化。

  • 技术挑战:超低延迟、高并发、海量数据实时处理、复杂的算法决策。

2. 自动化与智能化的外延

可程序化远不止RTB,它渗透到全链条:

  • 程序化创意(Programmatic Creative):根据用户画像动态组合广告的图文元素。

  • 程序化直投(Programmatic Direct):通过软件自动执行保量、优先等直接交易合约的投放和优化。

  • 智能预算分配(Smart Budget Allocation):算法自动跨渠道、跨时段分配预算。

  • 自动化的规则与策略(Automated Rules & Strategies):广告主可设置“若CPA高于X,则自动降低出价”等策略,系统自动执行。

可程序化的商业本质,是将广告交易从基于“关系”和“规模”的模糊批发,转变为基于“数据”和“价值”的精确零售。它极大地提升了市场效率,但也带来了复杂性和透明度等新问题。

总结:四大特点的合力与未来

可衡量性、可定向性、可交互性与可程序化,这四大技术特点并非简单并列,而是构成了一个强大的增强回路:

  • 因为可衡量,所以可优化,优化需要定向和程序化。

  • 因为可定向,所以衡量和程序化更有价值

  • 因为可交互,所以产生了更丰富的、可衡量的行为数据,进一步优化定向和程序化。

  • 因为可程序化,所以海量的定向、衡量和交互决策才能以工业级规模自动化执行。

它们共同作用,将广告从一个创意主导的、人力密集的、效果模糊的“传统行业”,重塑为一个数据与算法驱动的、自动化智能化的、效果高度可追踪和优化的“高科技行业”

从我的整体实践来看,中国在线广告产业的发展史,正是这四大特点逐步深化和应用的历史。早期门户时代,我们仅有初级的可衡量性和简陋的可定向性。搜索时代,可定向性(意图定向)和可衡量性(点击)实现突破。到了我在MediaV和360深度参与的移动与程序化时代,可程序化和深度的行为定向成为主角。而现在及未来,我们面临的挑战是:在隐私约束下,如何利用联邦学习等技术,在保护用户数据的前提下,延续甚至革新这些技术特点?同时,如何利用更强的AI(如生成式AI)提升可交互性的体验和可程序化的智能水平?这将是下一代计算广告技术的核心命题。

理解了这四大技术特点,我们就拥有了分析任何在线广告产品和技术的透镜。在下一节,我们将聚焦于所有计算广告系统都在解决的那个最核心、最根本的商业问题。

2.3 计算广告的核心问题

当我们穿越了广告有效性的心理迷雾,剖析了互联网媒介的四大技术利刃之后,现在终于可以直面整个计算广告领域最核心、最根本的商业命题。这个命题并非一个悬而未决的学术猜想,而是所有从业者——无论是产品经理、算法工程师还是商业决策者——每日都必须应对并给出答案的实践课题。

这个核心问题可以精炼地表述为:

给定一组用户和一组广告,如何在海量、实时、动态的展示机会(Inventory)中,找到每一次展示的最优匹配,以实现某一全局目标(通常是整个平台或广告系统的整体价值)的最大化?

这个看似抽象的问题,其解决方案构成了千亿美元在线广告产业的运行基石。它不仅是一个算法问题,更是一个涉及经济学、博弈论和系统设计的复杂系统工程。本节将深入解构这个核心问题,并将其具体化为两个可分析、可操作的子问题:广告收入的分解结算方式与eCPM估计的关系

一、核心问题的多维度解构

在深入公式之前,我们需要从几个层面来理解这个“最优匹配”问题的复杂性:

  1. 参与方的多元性:问题中至少涉及三方利益:用户(体验)、广告主(投资回报)、媒体平台(收入与生态健康)。最优匹配不是单方利益最大化,而是在三方之间寻找可持续的平衡点。

  2. 目标的层次性:全局目标可以有不同的定义:

    • 平台收入最大化:这是最直接的商业目标。

    • 广告主总价值最大化:追求平台为广告主创造的总价值最大,这有助于长期生态健康。

    • 用户体验伤害最小化:在保证收入的前提下,尽可能减少对用户的干扰。

    • 综合长期目标:通常是以上几者的加权组合。例如,“在保证用户体验指标不低于阈值的前提下,最大化平台长期收入”。

  3. 约束的多样性:匹配过程受到多重约束:

    • 广告主约束:预算、定向条件(人群、时间、地域)、出价、创意审核规则。

    • 平台约束:广告位尺寸、频次控制、品牌安全与内容合规、反作弊规则。

    • 用户约束:(隐性但至关重要)对糟糕广告的容忍度,表现为用脚投票(离开APP)或直接反馈(关闭广告)。

因此,计算广告系统本质上是一个“带有多方复杂约束的、实时、大规模的优化系统”

2.3.1 广告收入的分解

要理解如何最大化收入,首先要理解每一次广告展示所产生的收入是如何产生、如何流动、最终被谁获取的。这个过程如同一次精密的价值分解手术。

1. 单次广告展示的价值链条

当一个用户打开一个APP,产生一次广告展示机会,并最终被一个广告填充时,其产生的广告收入(以eCPM计)会在一个多层次的生态中进行分配。下图清晰地展示了在一个典型的、包含广告交易平台(ADX)的开放竞价生态中,收入的分解路径(见图2-3)。

+-------------------+ 赢得竞价 +-------------------+
| 广告主(Advertiser)| -------------> | 需求方平台(DSP) |
| | 支付最终费用 | |
+-------------------+ +-------------------+
| 支付竞价费用
v
+-------------------+ 发送广告请求 +-------------------+
| 媒体(Publisher) | <----------------- | 广告交易平台(ADX) |
| | 返回广告创意 | |
+-------------------+ +-------------------+
| 获得媒体分成 | 扣除交易平台费用
v v
[媒体实际收入] [ADX平台收入]

(注:DSP向ADX支付的“竞价费用”即为本次展示的成交价,通常按广义第二高价计。
ADX扣除一定比例(如10-20%)作为技术服务费后,将剩余部分支付给媒体。)

图2-3:开放竞价市场中单次广告展示的收入分解路径

以一个具体数字示例说明:

  • 假设一次展示,DSP A出价2元,DSP B出价1.5元(均为CPM价格)。

  • 根据广义第二高价规则,A赢得展示,但只需支付第二高的价格加一个最小单位(例如0.01元),即1.51元。这就是本次展示的“市场结算价”

  • 假设ADX与媒体的分成协议是“媒体分成率 = 80%”,ADX收取20%作为技术服务费。

  • 那么,媒体实际收入 = 1.51元 × 80% = 1.208元

  • ADX收入 = 1.51元 × 20% = 0.302元

  • 广告主(通过DSP A)最终支付1.51元。

2. 不同市场结构下的收入分解

上述是开放RTB市场的典型情况。在更复杂的市场结构中,链条可能更长或更短:

  • “围墙花园”内部闭环:如Facebook、抖音。广告主直接与平台交易。链条简化为:广告主 -> 平台。平台无需与外部SSP/ADX分成,掌握了全部收入和价值链。平台内部则通过算法直接将广告匹配给用户。

  • 包含供给方平台(SSP):大型媒体(如纽约时报)通常会使用自己的SSP来管理多个ADX的对接和统一竞价。链条变为:广告主->DSP->ADX->SSP->媒体。SSP会从媒体收入中再分走一部分(通常5-15%),作为流量管理和优化服务的报酬。

  • 合约广告:广告主或代理商直接与媒体签订保量合约。收入链条为:广告主/代理商 -> 媒体。但媒体内部在履行合约时,其自有的广告系统仍会进行内部的优化分配,以最低的成本完成合约承诺,这部分节省的成本或创造的多余价值成为媒体的利润。

3. 收入分解的产业意义

理解收入分解对于生态中的每一方都至关重要:

  • 对于媒体:追求的是自身实际收入的eCPM最大化。这意味着它不仅要争取高的市场结算价,还要谈判有利的分成比例,并减少中间环节的损耗。因此,优质媒体倾向于与ADX进行私有市场(PMP)交易或发展直客销售,以提升分成比例。

  • 对于ADX/SSP:它们是“流量批发商”和“市场搭建者”。其收入取决于总流水(GMV)佣金率。它们有动力扩大交易规模、提升竞价激烈程度(流动性),并提高技术服务的附加值以维持佣金率。

  • 对于DSP:它们是“流量零售商”。其商业模式是向广告主收取服务费(通常是广告花费的一个固定比例,如15-20%),或以技术授权费形式获利。其核心能力是以低于广告主目标成本(CPA)的价格,在ADX中竞得有转化价值的流量,赚取差价。DSP追求的是“自身利润 = 广告主总支出 × 服务费率 - 流量采购成本 - 运营成本”的最大化。

  • 对于广告主:他们最关心的是“最终转化成本(CPA)”投资回报率(ROI)。他们支付的价格是市场结算价加上DSP服务费。因此,广告主有动力选择更高效、更透明的DSP,并直接与优质媒体合作以去除中间环节。

从我的实践视角看,这种收入分解模型深刻地影响了产业竞争格局。在360商业化时期,我们既作为媒体(拥有浏览器、导航等流量),也运营着广告平台。这种双重身份让我们必须深刻理解内部博弈:作为媒体,我们希望把最优质的流量以最高的价格卖出;作为平台,我们需要保证有足够的、优质的流量供给来吸引广告主。这催生了内部“市场化”的结算机制,即平台需要像外部DSP一样,通过公平竞价来获取内部优质流量的一部分,这倒逼平台技术必须足够强,否则“肥水”也会流入外人田。

2.3.2 结算方式与eCPM估计的关系

如果说收入分解描述了“钱怎么分”,那么结算方式与eCPM估计则决定了“价值怎么算”和“谁该赢”。这是计算广告系统决策引擎的绝对核心,也是连接商业诉求与算法技术的桥梁。

1. 结算方式的“全家福”

结算方式定义了广告效果的计价单位,是广告主与媒体/平台之间风险与激励的分配契约。主要方式有:

  • CPM (Cost Per Mille): 按千次展示付费。

    • 风险承担:广告主承担效果风险(用户可能不点击不转化),媒体承担填充风险(必须展示足够次数)。

    • 适用场景:品牌广告,追求曝光和认知度。

  • CPC (Cost Per Click): 按点击付费。

    • 风险承担:广告主风险降低(只为点击付费),媒体风险增加(必须吸引用户点击)。

    • 适用场景:经典的效果广告,平衡了各方风险,是长期主流方式。

  • CPA (Cost Per Action)/CPI (Cost Per Install): 按行动/安装付费。

    • 风险承担:广告主风险进一步降低(只为最终转化付费),媒体/平台承担几乎所有效果风险。

    • 适用场景:对效果要求极高的广告主,如游戏下载、电商转化。通常需要平台有极强的预测和优化能力。

  • oCPM/oCPC (Optimized CPM/CPC): 优化千次展示/点击付费。

    • 本质:这是结算方式演进的里程碑。广告主按CPA目标出价,但结算仍按CPM或CPC进行。平台利用算法,预估每次展示的点击率和转化率,将CPA目标反向折算成实时的CPM或CPC出价,参与竞价。

    • 风险与激励:平台承担了核心的预估和优化风险,以此换取广告主的预算和信任。广告主获得更稳定的转化成本。这是平台技术实力的体现。

  • CPS (Cost Per Sale): 按销售分成。

    • 风险承担:风险完全共担,与销售结果深度绑定。

    • 适用场景:联盟营销、电商导购。

2. eCPM:统一的“价值度量衡”

在同一个竞价市场中,可能同时存在按CPM、CPC、甚至oCPA出价的广告主。如何让它们在同一杆秤上公平竞争?这就需要引入eCPM(expected Cost Per Mille, 期望千次展示收入)作为统一的“价值度量衡”。

eCPM的核心思想是:将不同结算方式下的出价,统一折算成平台在一次广告展示上所能获得的“期望收入”。

其通用公式为:
eCPM = p(Click) × p(Conversion|Click) × 目标转化价值 × 1000

在实际系统中,根据不同的结算方式,公式具体化为:

  1. 对于CPM出价广告:

    • eCPM = 出价(CPM价格)

    • 因为广告主直接为千次展示付费,期望收入即出价本身。

  2. 对于CPC出价广告:

    • eCPM =预估点击率(pCTR)× 出价(CPC价格) × 1000

    • 解释:一次展示的期望收入 = 点击概率 × 单次点击价格。乘以1000是为了统一到“千次展示”的尺度上。

  3. 对于oCPM/oCPA出价广告(广告主给出目标CPA):

    • eCPM =预估点击率(pCTR)×预估转化率(pCVR)× 目标CPA价格 × 1000

    • 解释:这是最完整的公式。一次展示的期望收入 = 点击概率 × (点击后)转化概率 × 单次转化价格。

广告排序与竞价获胜的规则通常是:按照eCPM从高到低排序,eCPM最高者胜出。这保证了在单次展示粒度上,平台能获得最高的期望收入。

3. 结算方式、eCPM与三方博弈的精妙平衡

这个框架精妙地平衡了广告主、平台和用户三方的利益:

  • 对平台而言:eCPM最大化是其直接收入目标。无论广告主如何出价,平台都通过预估模型(pCTR, pCVR)将其转化为统一的eCPM,从而做出全局最优的分配决策。

  • 对广告主而言:他们可以用自己最关心、最能控制的指标(CPC或CPA)来出价和衡量效果,无需理解复杂的eCPM折算过程。oCPM/oCPA模式更是将优化负担交给了平台,自己只需关心最终成本是否达标。

  • 对用户而言:eCPM排序规则无形中引入了“质量”因子。因为eCPM = pCTR × 出价。一个出价很高但预估点击率极低(即用户非常不感兴趣)的广告,其eCPM可能低于一个出价适中但预估点击率很高的广告。因此,eCPM排序在最大化平台收入的同时,也倾向于展示更相关、用户更可能点击的广告,客观上保护了用户体验。这就是为什么搜索和推荐广告系统要引入“质量度”或“用户体验分数”来进一步调节排序,其本质是对pCTR的强调,有时甚至采用eCPM = pCTR^α × 出价(其中α>1)的公式,给予用户体验更高的权重。

图2-4:结算方式、eCPM估计与广告排序决策流程图
(此处可配图:流程图展示决策过程。输入:一次广告请求,附带用户ID和上下文。步骤1:检索符合条件的广告候选集。步骤2:对每个广告,根据其结算类型(CPM/CPC/CPA)调用相应的pCTR/pCVR模型进行预测。步骤3:根据公式计算每个广告的eCPM。步骤4:按eCPM降序排序。步骤5:选择eCPM最高者展示。图中突出pCTR/pCVR预测模型是关键。)

4. 从我的实践视角看:eCPM估计的演进与挑战

eCPM公式的简洁性背后,是极其复杂的技术挑战。pCTR和pCVR的预估精度,是计算广告系统的“命门”

雅虎研究院的早期,我们主要使用逻辑回归(LR)和梯度提升树(GBDT)来预估pCTR。特征工程是核心,如何从用户行为日志中构造出有效的特征(如用户历史点击某类广告的次数、广告与当前页面的主题匹配度),决定了模型的天花板。

到了MediaV和360的程序化时代,竞争进入白热化。pCTR预估的细微提升(例如AUC增加0.1%),直接意味着在大量竞价中能以更低成本获胜或更高价格卖出,带来巨大的收入增益。我们开始探索更复杂的模型,如因子分解机(FM)和早期的深度模型,以更好地捕捉特征间的组合效应。

而现在,在深度学习时代,pCTR预估模型已经发展到DeepFM、DIN、DIEN等复杂结构。它们不仅能处理高维稀疏特征,更能建模用户兴趣的动态演化。例如,DIEN模型通过模拟用户点击序列,能够判断用户当前是处于稳定的兴趣阶段,还是兴趣正在发生转移。这对预测其下一刻会点击什么广告至关重要。

然而,最大的挑战来自于“反馈闭环的偏见”“探索与利用的困境”

  • 偏见问题:训练pCTR模型的数据,来自于历史展示和点击日志。但历史展示本身就是旧模型决策的结果(高pCTR的广告才被展示)。这导致模型会不断强化已有的偏见,对那些历史上展示少、但可能潜在点击率高的新广告或新创意不公平。这需要引入逆倾向评分(IPS)等因果推断技术进行纠偏。

  • 探索与利用:为了准确估计一个新广告的pCTR,系统必须给它一定的曝光机会(探索)。但探索意味着可能牺牲短期收入(利用已知的高pCTR广告)。如何在探索新可能性和利用已知确定性之间平衡,是强化学习(如Bandit算法)要解决的核心问题。

结论:
计算广告的核心问题,通过“收入分解”明确了价值流动的路径,通过“结算方式与eCPM估计”构建了价值衡量和决策的统一框架。eCPM公式是这个框架的结晶,它将商业目标(出价)、用户体验(预估点击率)和技术能力(预估模型)完美地融合在一个等式中。理解这个等式,就理解了计算广告所有产品设计、算法优化和商业谈判的底层逻辑。它告诉我们,在这个智能匹配的时代,广告竞争的终极维度,已经演变为对用户注意力与意图的预测精度之战。在接下来的章节中,我们将看到这个核心框架如何具体落地为各种在线广告产品。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!