目录
2.2 互联网广告的技术特点
一、可衡量性(Measurability):从“迷雾”到“显微镜”
1. 测量维度的革命
2. 从“衡量结果”到“优化过程”
二、可定向性(Targetability):从“广播”到“狙击”
1. 定向技术的演进谱系
2. 技术实现:标签系统与实时决策
三、可交互性(Interactivity):从“诉说”到“对话”
1. 交互层次的深化
2. 技术支撑
四、可程序化(Programmability):从“手工”到“自动化”的产业重塑
1. 核心:实时竞价(RTB)
2. 自动化与智能化的外延
总结:四大特点的合力与未来
2.3 计算广告的核心问题
一、核心问题的多维度解构
2.3.1 广告收入的分解
1. 单次广告展示的价值链条
2. 不同市场结构下的收入分解
3. 收入分解的产业意义
2.3.2 结算方式与eCPM估计的关系
1. 结算方式的“全家福”
2. eCPM:统一的“价值度量衡”
3. 结算方式、eCPM与三方博弈的精妙平衡
4. 从我的实践视角看:eCPM估计的演进与挑战
2.2 互联网广告的技术特点
当我们从原理层面理解了广告何以有效,一个随之而来的问题便是:这种有效性,如何在互联网这一特定介质上被系统地实现、放大和优化?互联网并非简单的“另一个媒体渠道”,它是一套全新的技术基础设施。这套设施赋予广告一系列传统媒体无法企及的革命性特点,正是这些特点,使得“计算广告”从概念变为现实,并催生出一个庞大的技术驱动型产业。
本节将深入剖析互联网广告区别于传统广告的四大核心技术特点:可衡量性、可定向性、可交互性与可程序化。这四大特点并非彼此孤立,而是层层递进、相互增强,共同构成了现代在线广告系统的技术基石。理解它们,是理解所有后续产品、技术和商业逻辑的钥匙。
一、可衡量性(Measurability):从“迷雾”到“显微镜”
传统广告效果衡量如同在迷雾中估测距离,而互联网广告的衡量则像是在显微镜下观察细胞。其核心在于,数字世界的每一次用户与广告的接触,都能以日志的形式被精确记录,形成一个完整、闭环的数据反馈系统。
1. 测量维度的革命
曝光(Impression):广告被下载并展示在用户设备上的次数。这是最基础的计量单位,对应传统媒体的“发行量”或“收视率”,但更精确。
点击(Click):用户主动与广告互动的行为。这是数字广告独有的、革命性的指标,它标志着用户从“被动接收”进入“主动探索”阶段。点击率(CTR)成为衡量广告吸引力和相关性的黄金指标。
转化(Conversion):用户点击后完成的具有商业价值的特定行为,如下载、注册、购买、留资等。转化率(CVR)直接连接了广告支出与商业回报。
后续行为(Post-Conversion):转化后的用户活跃度、复购率、生命周期价值(LTV)等。这衡量了广告带来的用户质量。
“可衡量性”的实现,依赖于一整套技术栈:
前端监测代码(Tracking Pixel/SDK):嵌入在网页或APP中,在广告展示、点击或应用内关键行为发生时,向广告服务器的日志系统发送一条记录。
广告服务器(Ad Server):不仅是投放引擎,也是中央化的数据记录仪,统一记录所有曝露、点击数据。
归因分析平台:将分散在不同渠道、不同时间的用户接触点与最终转化串联起来,解决“功劳归谁”的问题。
2. 从“衡量结果”到“优化过程”
可衡量性的真正威力,不在于事后报告,而在于实时反馈与在线优化。
A/B测试成为常态:可以同时在线测试两个不同的创意、两个不同的出价策略或两个不同的人群定向,并依据实时数据(如CTR)快速决定优胜者。
动态出价:基于对当前流量实时预估的CTR和CVR,动态调整每次竞价的出价,实现“不同的人,不同的价”。
预算自动化分配:系统可以实时监控各渠道、各广告计划的转化成本和ROI,自动将预算从效果差的计划调往效果好的计划。
挑战与演进:
归因难题:跨设备、跨渠道的归因仍是技术挑战。苹果的SKAdNetwork等隐私框架引入了数据延迟和聚合,给实时优化带来困难。
衡量欺诈:虚假流量(Bot Traffic)、点击欺诈等一直与可衡量性如影随形,催生了庞大的反作弊技术产业。
从“最后点击”到“全触点衡量”:行业正从简单粗暴的“最后点击归因”向更科学的“数据驱动归因(DDA)”演进,以更公平地衡量品牌曝光等非直接转化类广告的价值。
从我的实践视角看,在雅虎和MediaV的早期,我们花大力气建立的可信、统一的监测体系,是赢得广告主信任的基石。在360,由于我们同时拥有媒体(浏览器、安全产品)和广告平台(DSP)角色,我们深刻体会到“围墙花园”内外衡量标准的割裂。花园内(如Facebook)的数据闭环且完整,但对外不透明;花园外的开放网络则需要依赖可能被拦截或失真的第三方监测代码。这种割裂今天依然是行业痛点。
二、可定向性(Targetability):从“广播”到“狙击”
如果说可衡量性解决了“效果如何”的问题,可定向性则解决了“给谁看”的问题。它指的是将特定广告投放给特定人群的能力,其精度从模糊的人口统计区间,一直可以提升到个体级别。这是互联网广告精准化的核心。
1. 定向技术的演进谱系
定向能力的发展,是一部数据利用深度不断进化的历史:
上下文定向(Contextual Targeting):根据广告所在页面的内容来投放相关广告(例如,在体育新闻页面投放运动鞋广告)。技术基础是自然语言处理(NLP)和主题分类。
地域定向(Geographic Targeting):基于用户IP地址或GPS位置。
人口属性定向(Demographic Targeting):推测用户的年龄、性别、收入等。早期通过注册信息,如今更多通过机器学习模型基于行为数据预测。
行为定向(Behavioral Targeting):定向技术的飞跃。通过分析用户长期的历史浏览、搜索、购买等行为,构建兴趣标签体系(例如,“数码爱好者”、“备孕妈妈”)。这是程序化广告的基石。
意图定向(Intent Targeting):捕捉用户当下的实时意图,最典型的是搜索关键词。这是转化率最高的定向方式。
人群扩展(Look-alike Modeling):定向技术的集大成者。给定一小群种子用户(如高价值客户),通过机器学习算法在全网寻找与其特征相似的潜在用户。它实现了定向从“规则定义”到“模型发现”的升级。
图2-2:广告定向技术演进与数据深度关系图
(此处可配图:一个从左到右的箭头,标示“数据利用深度”增加。从左至右排列:上下文定向(利用页面数据)、地域定向(利用位置数据)、人口属性定向(利用推测数据)、行为定向(利用历史行为数据)、意图定向(利用实时行为数据)、人群扩展(利用种子用户+全网行为数据)。)
2. 技术实现:标签系统与实时决策
标签体系(Tagging System):是定向的“语言”。一个结构化的、可扩展的标签分类体系(Taxonomy)是基础。标签可以是预先定义的(如行业分类),也可以是算法实时挖掘的(如动态兴趣点)。
实时用户画像(Real-time User Profile):系统需要将分散在多个数据源的用户行为,在毫秒级内汇聚成统一的、可用于定向的画像。这依赖于高性能的键值存储(如Redis)和实时流处理技术。
定向逻辑服务器(Targeting Logic Server):在广告检索时,快速判断请求中的用户ID是否命中广告主设置的复杂定向条件组合(如“北京且男性且(爱好汽车或科技)且最近7天搜索过‘新能源车’”)。
挑战与演进:
隐私之殇:基于跨站追踪的行为定向,是当前隐私监管打击的核心。第三方Cookie和移动设备ID的消亡,正在迫使行业寻找新范式。
数据孤岛:用户数据分散在各个“围墙花园”内,难以形成跨平台的统一视图。
解决方案探索:联邦学习、差分隐私、基于第一方数据的协作(如Clean Room),以及谷歌倡导的基于兴趣群体(Topics API)的隐私沙盒方案,都是试图在保护隐私前提下保留一定定向能力的技术尝试。
三、可交互性(Interactivity):从“诉说”到“对话”
互联网广告不是一幅静止的平面海报或一段单向的电视广告。它允许,甚至鼓励用户实时参与和互动,这彻底改变了广告沟通的模式。
1. 交互层次的深化
点击(Click):最基本的交互,将用户从曝光场景带至落地页,开启深度沟通。
富媒体交互(Rich Media Interaction):广告单元本身即可包含视频播放、360度产品旋转、迷你游戏、表单填写等,用户无需离开当前页面即可完成深度互动,极大提升体验和转化效率。
社交互动(Social Engagement):点赞、评论、分享。广告成为社交话题的起点,其传播力被指数级放大。
直接行动(Direct Action):在广告单元内直接完成核心操作,如一键预约、一键加购、一键下载。这得益于移动生态的完善(如微信小程序),将转化路径缩短到极致。
2. 技术支撑
HTML5与WebGL:使得在浏览器内创建复杂的交互式广告成为可能,无需插件。
小程序与快应用:提供接近原生APP的体验,且即点即用,是“直接行动”型广告的理想载体。
增强现实(AR)广告:用户可通过摄像头“试用”产品(如试戴眼镜、试摆家具),互动性和体验感极强。
可交互性的意义在于,它将广告从“成本中心”(需要额外的落地页成本)部分转变为“体验中心”甚至“销售终端”,直接创造了价值。
四、可程序化(Programmability):从“手工”到“自动化”的产业重塑
这是互联网广告最本质、也是最具颠覆性的技术特点。它意味着广告的购买、售卖、投放和优化全过程,可以通过软件和算法自动执行,无需人工逐笔谈判和操作。它催生了“程序化交易”这一全新产业。
1. 核心:实时竞价(RTB)
RTB是可程序化的巅峰体现。它将每一次广告展示机会,都变成了一次在公开市场或私有市场上的实时、自动化拍卖。
流程(在<100毫秒内完成):
用户访问媒体页面。
媒体SSP向ADX发送广告请求,附带用户匿名ID。
ADX向多家DSP发送竞价请求(Bid Request)。
各DSP的算法基于用户数据、上下文等,在毫秒内决定是否出价及出价多少。
出价最高的DSP赢得展示,其广告创意被返回并展示给用户。
竞价结果、后续点击/转化数据通过日志返回各方,用于模型优化。
技术挑战:超低延迟、高并发、海量数据实时处理、复杂的算法决策。
2. 自动化与智能化的外延
可程序化远不止RTB,它渗透到全链条:
程序化创意(Programmatic Creative):根据用户画像动态组合广告的图文元素。
程序化直投(Programmatic Direct):通过软件自动执行保量、优先等直接交易合约的投放和优化。
智能预算分配(Smart Budget Allocation):算法自动跨渠道、跨时段分配预算。
自动化的规则与策略(Automated Rules & Strategies):广告主可设置“若CPA高于X,则自动降低出价”等策略,系统自动执行。
可程序化的商业本质,是将广告交易从基于“关系”和“规模”的模糊批发,转变为基于“数据”和“价值”的精确零售。它极大地提升了市场效率,但也带来了复杂性和透明度等新问题。
总结:四大特点的合力与未来
可衡量性、可定向性、可交互性与可程序化,这四大技术特点并非简单并列,而是构成了一个强大的增强回路:
因为可衡量,所以可优化,优化需要定向和程序化。
因为可定向,所以衡量和程序化更有价值。
因为可交互,所以产生了更丰富的、可衡量的行为数据,进一步优化定向和程序化。
因为可程序化,所以海量的定向、衡量和交互决策才能以工业级规模自动化执行。
它们共同作用,将广告从一个创意主导的、人力密集的、效果模糊的“传统行业”,重塑为一个数据与算法驱动的、自动化智能化的、效果高度可追踪和优化的“高科技行业”。
从我的整体实践来看,中国在线广告产业的发展史,正是这四大特点逐步深化和应用的历史。早期门户时代,我们仅有初级的可衡量性和简陋的可定向性。搜索时代,可定向性(意图定向)和可衡量性(点击)实现突破。到了我在MediaV和360深度参与的移动与程序化时代,可程序化和深度的行为定向成为主角。而现在及未来,我们面临的挑战是:在隐私约束下,如何利用联邦学习等技术,在保护用户数据的前提下,延续甚至革新这些技术特点?同时,如何利用更强的AI(如生成式AI)提升可交互性的体验和可程序化的智能水平?这将是下一代计算广告技术的核心命题。
理解了这四大技术特点,我们就拥有了分析任何在线广告产品和技术的透镜。在下一节,我们将聚焦于所有计算广告系统都在解决的那个最核心、最根本的商业问题。
2.3 计算广告的核心问题
当我们穿越了广告有效性的心理迷雾,剖析了互联网媒介的四大技术利刃之后,现在终于可以直面整个计算广告领域最核心、最根本的商业命题。这个命题并非一个悬而未决的学术猜想,而是所有从业者——无论是产品经理、算法工程师还是商业决策者——每日都必须应对并给出答案的实践课题。
这个核心问题可以精炼地表述为:
给定一组用户和一组广告,如何在海量、实时、动态的展示机会(Inventory)中,找到每一次展示的最优匹配,以实现某一全局目标(通常是整个平台或广告系统的整体价值)的最大化?
这个看似抽象的问题,其解决方案构成了千亿美元在线广告产业的运行基石。它不仅是一个算法问题,更是一个涉及经济学、博弈论和系统设计的复杂系统工程。本节将深入解构这个核心问题,并将其具体化为两个可分析、可操作的子问题:广告收入的分解与结算方式与eCPM估计的关系。
一、核心问题的多维度解构
在深入公式之前,我们需要从几个层面来理解这个“最优匹配”问题的复杂性:
参与方的多元性:问题中至少涉及三方利益:用户(体验)、广告主(投资回报)、媒体平台(收入与生态健康)。最优匹配不是单方利益最大化,而是在三方之间寻找可持续的平衡点。
目标的层次性:全局目标可以有不同的定义:
平台收入最大化:这是最直接的商业目标。
广告主总价值最大化:追求平台为广告主创造的总价值最大,这有助于长期生态健康。
用户体验伤害最小化:在保证收入的前提下,尽可能减少对用户的干扰。
综合长期目标:通常是以上几者的加权组合。例如,“在保证用户体验指标不低于阈值的前提下,最大化平台长期收入”。
约束的多样性:匹配过程受到多重约束:
广告主约束:预算、定向条件(人群、时间、地域)、出价、创意审核规则。
平台约束:广告位尺寸、频次控制、品牌安全与内容合规、反作弊规则。
用户约束:(隐性但至关重要)对糟糕广告的容忍度,表现为用脚投票(离开APP)或直接反馈(关闭广告)。
因此,计算广告系统本质上是一个“带有多方复杂约束的、实时、大规模的优化系统”。
2.3.1 广告收入的分解
要理解如何最大化收入,首先要理解每一次广告展示所产生的收入是如何产生、如何流动、最终被谁获取的。这个过程如同一次精密的价值分解手术。
1. 单次广告展示的价值链条
当一个用户打开一个APP,产生一次广告展示机会,并最终被一个广告填充时,其产生的广告收入(以eCPM计)会在一个多层次的生态中进行分配。下图清晰地展示了在一个典型的、包含广告交易平台(ADX)的开放竞价生态中,收入的分解路径(见图2-3)。
+-------------------+ 赢得竞价 +-------------------+
| 广告主(Advertiser)| -------------> | 需求方平台(DSP) |
| | 支付最终费用 | |
+-------------------+ +-------------------+
| 支付竞价费用
v
+-------------------+ 发送广告请求 +-------------------+
| 媒体(Publisher) | <----------------- | 广告交易平台(ADX) |
| | 返回广告创意 | |
+-------------------+ +-------------------+
| 获得媒体分成 | 扣除交易平台费用
v v
[媒体实际收入] [ADX平台收入](注:DSP向ADX支付的“竞价费用”即为本次展示的成交价,通常按广义第二高价计。
ADX扣除一定比例(如10-20%)作为技术服务费后,将剩余部分支付给媒体。)
图2-3:开放竞价市场中单次广告展示的收入分解路径
以一个具体数字示例说明:
假设一次展示,DSP A出价2元,DSP B出价1.5元(均为CPM价格)。
根据广义第二高价规则,A赢得展示,但只需支付第二高的价格加一个最小单位(例如0.01元),即1.51元。这就是本次展示的“市场结算价”。
假设ADX与媒体的分成协议是“媒体分成率 = 80%”,ADX收取20%作为技术服务费。
那么,媒体实际收入 = 1.51元 × 80% = 1.208元。
ADX收入 = 1.51元 × 20% = 0.302元。
广告主(通过DSP A)最终支付1.51元。
2. 不同市场结构下的收入分解
上述是开放RTB市场的典型情况。在更复杂的市场结构中,链条可能更长或更短:
“围墙花园”内部闭环:如Facebook、抖音。广告主直接与平台交易。链条简化为:广告主 -> 平台。平台无需与外部SSP/ADX分成,掌握了全部收入和价值链。平台内部则通过算法直接将广告匹配给用户。
包含供给方平台(SSP):大型媒体(如纽约时报)通常会使用自己的SSP来管理多个ADX的对接和统一竞价。链条变为:广告主->DSP->ADX->SSP->媒体。SSP会从媒体收入中再分走一部分(通常5-15%),作为流量管理和优化服务的报酬。
合约广告:广告主或代理商直接与媒体签订保量合约。收入链条为:广告主/代理商 -> 媒体。但媒体内部在履行合约时,其自有的广告系统仍会进行内部的优化分配,以最低的成本完成合约承诺,这部分节省的成本或创造的多余价值成为媒体的利润。
3. 收入分解的产业意义
理解收入分解对于生态中的每一方都至关重要:
对于媒体:追求的是自身实际收入的eCPM最大化。这意味着它不仅要争取高的市场结算价,还要谈判有利的分成比例,并减少中间环节的损耗。因此,优质媒体倾向于与ADX进行私有市场(PMP)交易或发展直客销售,以提升分成比例。
对于ADX/SSP:它们是“流量批发商”和“市场搭建者”。其收入取决于总流水(GMV)和佣金率。它们有动力扩大交易规模、提升竞价激烈程度(流动性),并提高技术服务的附加值以维持佣金率。
对于DSP:它们是“流量零售商”。其商业模式是向广告主收取服务费(通常是广告花费的一个固定比例,如15-20%),或以技术授权费形式获利。其核心能力是以低于广告主目标成本(CPA)的价格,在ADX中竞得有转化价值的流量,赚取差价。DSP追求的是“自身利润 = 广告主总支出 × 服务费率 - 流量采购成本 - 运营成本”的最大化。
对于广告主:他们最关心的是“最终转化成本(CPA)”和投资回报率(ROI)。他们支付的价格是市场结算价加上DSP服务费。因此,广告主有动力选择更高效、更透明的DSP,并直接与优质媒体合作以去除中间环节。
从我的实践视角看,这种收入分解模型深刻地影响了产业竞争格局。在360商业化时期,我们既作为媒体(拥有浏览器、导航等流量),也运营着广告平台。这种双重身份让我们必须深刻理解内部博弈:作为媒体,我们希望把最优质的流量以最高的价格卖出;作为平台,我们需要保证有足够的、优质的流量供给来吸引广告主。这催生了内部“市场化”的结算机制,即平台需要像外部DSP一样,通过公平竞价来获取内部优质流量的一部分,这倒逼平台技术必须足够强,否则“肥水”也会流入外人田。
2.3.2 结算方式与eCPM估计的关系
如果说收入分解描述了“钱怎么分”,那么结算方式与eCPM估计则决定了“价值怎么算”和“谁该赢”。这是计算广告系统决策引擎的绝对核心,也是连接商业诉求与算法技术的桥梁。
1. 结算方式的“全家福”
结算方式定义了广告效果的计价单位,是广告主与媒体/平台之间风险与激励的分配契约。主要方式有:
CPM (Cost Per Mille): 按千次展示付费。
风险承担:广告主承担效果风险(用户可能不点击不转化),媒体承担填充风险(必须展示足够次数)。
适用场景:品牌广告,追求曝光和认知度。
CPC (Cost Per Click): 按点击付费。
风险承担:广告主风险降低(只为点击付费),媒体风险增加(必须吸引用户点击)。
适用场景:经典的效果广告,平衡了各方风险,是长期主流方式。
CPA (Cost Per Action)/CPI (Cost Per Install): 按行动/安装付费。
风险承担:广告主风险进一步降低(只为最终转化付费),媒体/平台承担几乎所有效果风险。
适用场景:对效果要求极高的广告主,如游戏下载、电商转化。通常需要平台有极强的预测和优化能力。
oCPM/oCPC (Optimized CPM/CPC): 优化千次展示/点击付费。
本质:这是结算方式演进的里程碑。广告主按CPA目标出价,但结算仍按CPM或CPC进行。平台利用算法,预估每次展示的点击率和转化率,将CPA目标反向折算成实时的CPM或CPC出价,参与竞价。
风险与激励:平台承担了核心的预估和优化风险,以此换取广告主的预算和信任。广告主获得更稳定的转化成本。这是平台技术实力的体现。
CPS (Cost Per Sale): 按销售分成。
风险承担:风险完全共担,与销售结果深度绑定。
适用场景:联盟营销、电商导购。
2. eCPM:统一的“价值度量衡”
在同一个竞价市场中,可能同时存在按CPM、CPC、甚至oCPA出价的广告主。如何让它们在同一杆秤上公平竞争?这就需要引入eCPM(expected Cost Per Mille, 期望千次展示收入)作为统一的“价值度量衡”。
eCPM的核心思想是:将不同结算方式下的出价,统一折算成平台在一次广告展示上所能获得的“期望收入”。
其通用公式为:
eCPM = p(Click) × p(Conversion|Click) × 目标转化价值 × 1000
在实际系统中,根据不同的结算方式,公式具体化为:
对于CPM出价广告:
eCPM = 出价(CPM价格)
因为广告主直接为千次展示付费,期望收入即出价本身。
对于CPC出价广告:
eCPM =预估点击率(pCTR)× 出价(CPC价格) × 1000
解释:一次展示的期望收入 = 点击概率 × 单次点击价格。乘以1000是为了统一到“千次展示”的尺度上。
对于oCPM/oCPA出价广告(广告主给出目标CPA):
eCPM =预估点击率(pCTR)×预估转化率(pCVR)× 目标CPA价格 × 1000
解释:这是最完整的公式。一次展示的期望收入 = 点击概率 × (点击后)转化概率 × 单次转化价格。
广告排序与竞价获胜的规则通常是:按照eCPM从高到低排序,eCPM最高者胜出。这保证了在单次展示粒度上,平台能获得最高的期望收入。
3. 结算方式、eCPM与三方博弈的精妙平衡
这个框架精妙地平衡了广告主、平台和用户三方的利益:
对平台而言:eCPM最大化是其直接收入目标。无论广告主如何出价,平台都通过预估模型(pCTR, pCVR)将其转化为统一的eCPM,从而做出全局最优的分配决策。
对广告主而言:他们可以用自己最关心、最能控制的指标(CPC或CPA)来出价和衡量效果,无需理解复杂的eCPM折算过程。oCPM/oCPA模式更是将优化负担交给了平台,自己只需关心最终成本是否达标。
对用户而言:eCPM排序规则无形中引入了“质量”因子。因为eCPM = pCTR × 出价。一个出价很高但预估点击率极低(即用户非常不感兴趣)的广告,其eCPM可能低于一个出价适中但预估点击率很高的广告。因此,eCPM排序在最大化平台收入的同时,也倾向于展示更相关、用户更可能点击的广告,客观上保护了用户体验。这就是为什么搜索和推荐广告系统要引入“质量度”或“用户体验分数”来进一步调节排序,其本质是对pCTR的强调,有时甚至采用
eCPM = pCTR^α × 出价(其中α>1)的公式,给予用户体验更高的权重。
图2-4:结算方式、eCPM估计与广告排序决策流程图
(此处可配图:流程图展示决策过程。输入:一次广告请求,附带用户ID和上下文。步骤1:检索符合条件的广告候选集。步骤2:对每个广告,根据其结算类型(CPM/CPC/CPA)调用相应的pCTR/pCVR模型进行预测。步骤3:根据公式计算每个广告的eCPM。步骤4:按eCPM降序排序。步骤5:选择eCPM最高者展示。图中突出pCTR/pCVR预测模型是关键。)
4. 从我的实践视角看:eCPM估计的演进与挑战
eCPM公式的简洁性背后,是极其复杂的技术挑战。pCTR和pCVR的预估精度,是计算广告系统的“命门”。
在雅虎研究院的早期,我们主要使用逻辑回归(LR)和梯度提升树(GBDT)来预估pCTR。特征工程是核心,如何从用户行为日志中构造出有效的特征(如用户历史点击某类广告的次数、广告与当前页面的主题匹配度),决定了模型的天花板。
到了MediaV和360的程序化时代,竞争进入白热化。pCTR预估的细微提升(例如AUC增加0.1%),直接意味着在大量竞价中能以更低成本获胜或更高价格卖出,带来巨大的收入增益。我们开始探索更复杂的模型,如因子分解机(FM)和早期的深度模型,以更好地捕捉特征间的组合效应。
而现在,在深度学习时代,pCTR预估模型已经发展到DeepFM、DIN、DIEN等复杂结构。它们不仅能处理高维稀疏特征,更能建模用户兴趣的动态演化。例如,DIEN模型通过模拟用户点击序列,能够判断用户当前是处于稳定的兴趣阶段,还是兴趣正在发生转移。这对预测其下一刻会点击什么广告至关重要。
然而,最大的挑战来自于“反馈闭环的偏见”和“探索与利用的困境”。
偏见问题:训练pCTR模型的数据,来自于历史展示和点击日志。但历史展示本身就是旧模型决策的结果(高pCTR的广告才被展示)。这导致模型会不断强化已有的偏见,对那些历史上展示少、但可能潜在点击率高的新广告或新创意不公平。这需要引入逆倾向评分(IPS)等因果推断技术进行纠偏。
探索与利用:为了准确估计一个新广告的pCTR,系统必须给它一定的曝光机会(探索)。但探索意味着可能牺牲短期收入(利用已知的高pCTR广告)。如何在探索新可能性和利用已知确定性之间平衡,是强化学习(如Bandit算法)要解决的核心问题。
结论:
计算广告的核心问题,通过“收入分解”明确了价值流动的路径,通过“结算方式与eCPM估计”构建了价值衡量和决策的统一框架。eCPM公式是这个框架的结晶,它将商业目标(出价)、用户体验(预估点击率)和技术能力(预估模型)完美地融合在一个等式中。理解这个等式,就理解了计算广告所有产品设计、算法优化和商业谈判的底层逻辑。它告诉我们,在这个智能匹配的时代,广告竞争的终极维度,已经演变为对用户注意力与意图的预测精度之战。在接下来的章节中,我们将看到这个核心框架如何具体落地为各种在线广告产品。