过去做品牌可见度评估,核心关注的是搜索排名、网页收录、关键词覆盖、内容曝光和平台流量。
但进入生成式AI时代之后,一个新的问题出现了:
当用户不再搜索关键词,而是直接问AI“我该选什么”时,品牌还会不会被AI想起?会不会被AI推荐?AI又会怎样解释这个品牌?
这就是GEO,即Generative Engine Optimization,生成式引擎优化,正在关注的问题。
和传统SEO不同,GEO不只关心网页能不能被搜索引擎收录,也不只关心关键词排名,而是关心品牌、产品、机构或内容,能否进入大模型生成答案的过程。
换句话说,SEO解决的是“搜索结果页有没有你”,GEO解决的是“AI生成答案里有没有你”。
最近,我们基于6个主流AI平台、3600次独立提问,做了一次“AI年轻人生活搭子指数”观察。这个案例本身是一个品牌榜单,但更值得讨论的,其实是背后的评测方法:
如何用数据衡量一个品牌在AI回答中的心智表现?
一、为什么需要评测品牌在AI回答中的表现?
传统搜索场景中,用户输入的是关键词。
比如:
- 咖啡品牌推荐
- 年轻人茶饮品牌
- 平价彩妆品牌
- 通勤穿搭品牌
- 朋友聚会饮品推荐
搜索引擎返回的是一组网页链接,用户再自己点击、阅读、比较、判断。
但在AI问答场景中,用户的问题往往变成完整的生活场景:
- 上班困了,喝什么比较合适?
- 朋友聚会买什么饮品不容易出错?
- 预算有限,怎么提升一点生活幸福感?
- 新手化妆可以参考哪些品牌?
- 通勤穿搭怎么选比较省心?
这时候,AI不会简单返回十个网页链接,而是直接生成一段答案。
它可能会提到某些品牌,也可能会明确推荐某些品牌,还可能会解释为什么这些品牌适合这个场景。
这就带来了一个新的评测对象:
品牌在AI生成答案中的出现概率、推荐概率和解释质量。
在这种场景下,品牌竞争不再只是搜索排名竞争,也不再只是内容平台流量竞争,而是进入了AI回答系统的生成过程。
对品牌来说,新的问题变成:
- AI知道我是谁吗?
- AI在什么场景下会想起我?
- AI会不会主动推荐我?
- AI推荐我的理由是否准确?
- AI是否会把竞品放在我前面?
- 不同AI平台对我的理解是否一致?
这些问题,就是AI心智指数试图量化的方向。
二、AI心智指数测的不是“消费者喜欢谁”
这里需要先说明一个边界。
AI心智指数不是消费者调研,不是市场份额排名,也不是产品质量评价。它不回答“消费者最喜欢谁”,也不回答“哪个品牌最好”。
它观察的是:
在特定问题集、特定AI平台、特定采集周期内,品牌在AI生成式回答中的表现。
更具体地说,它衡量的是品牌是否容易被AI:
- 想起
- 提到
- 推荐
- 解释
- 放进具体使用场景
所以,这类评测更接近一种“AI回答结果评测”或“生成式搜索可见度评测”。
如果从技术产品角度理解,可以把AI心智指数看作一个面向品牌GEO的评测系统。
它的核心不是“榜单本身”,而是通过大量问题采集,统计AI回答中的品牌出现方式,进而判断品牌在生成式回答中的可见度和推荐强度。
三、本次评测样本设计
本次“AI年轻人生活搭子指数”观察,采用了以下采集设计:
- 覆盖6个主流AI平台
- 每个平台600次独立提问
- 共计3600次AI回答采集
- 问题围绕年轻人生活消费场景展开
- 重点观察品牌在回答中的提及率、推荐率和综合表现
覆盖平台包括:
- 豆包
- DeepSeek
- 通义千问
- 文心一言
- Kimi
- 腾讯元宝
问题集主要围绕年轻人日常生活消费场景设计,例如饮品、快餐、美妆、服饰、平价零售、潮玩、生活科技、通勤、社交、悦己消费等方向。
这里有一个关键点:
问题不能只设计成品牌词或品类词,而要尽量接近真实用户会问AI的问题。
如果只问“咖啡品牌有哪些”,得到的结果更像传统搜索列表。
但如果问“上班困了喝什么比较适合年轻人”,得到的结果就更接近AI场景推荐。
GEO评测的价值,恰恰在于模拟用户真实问题,而不是只跑关键词排名。
四、三个核心指标:提及率、推荐率、综合指数
在本次评测中,我们重点使用了三个指标。
1. 提及率:AI是否容易想起品牌
提及率指的是:
某品牌在AI回答中被提到的比例。
如果一个品牌在100次回答中出现了70次,那么它的提及率就是70%。
提及率反映的是品牌在AI回答中的基础可见度。
它回答的问题是:
AI在相关问题中是否容易想到这个品牌?
在传统SEO里,我们可能关注关键词排名和曝光量;在GEO里,提及率就相当于品牌在AI答案中的基础曝光能力。
提及率高,说明品牌更容易进入AI的候选答案集合。
但提及率高不等于一定被推荐。因为AI可能只是提到某个品牌作为示例,并没有把它作为明确建议。
2. 推荐率:AI是否愿意把品牌作为答案输出
推荐率指的是:
某品牌在AI回答中被明确推荐、建议或作为解决方案出现的比例。
比如AI回答中出现:
- “可以考虑瑞幸”
- “推荐选择优衣库的基础款”
- “如果预算有限,可以看看蜜雪冰城”
- “新手彩妆可以从完美日记这类品牌入门”
这类表达就不只是提及,而是推荐。
推荐率比提及率更接近AI回答中的行动建议。
它回答的问题是:
AI是否愿意把这个品牌推荐给用户?
从商业价值看,推荐率通常比提及率更重要。
因为用户问AI,大多数时候不是为了看品牌列表,而是为了获得建议。
3. 综合指数:品牌整体AI心智表现
综合指数是对品牌在不同平台、不同问题和不同指标表现的综合计算。
它不是简单的提及率排名,也不是单一推荐率排名,而是试图衡量品牌在AI回答中的整体心智强度。
综合指数适合做主榜。
提及率适合观察“谁更容易被AI想起”。
推荐率适合观察“谁更容易被AI推荐”。
三者结合起来,才能更完整地看品牌在AI回答中的表现。
五、一个有价值的衍生指标:AI推荐转化率
除了提及率和推荐率,本次观察还可以引入一个很有解释力的指标:
AI推荐转化率 = 推荐率 ÷ 提及率
它衡量的是:
当AI已经想起一个品牌之后,有多大概率进一步把它推荐出去。
这个指标非常适合用于GEO分析。
因为它把“被看见”和“被推荐”区分开了。
有些品牌知名度高,AI经常提到,但不一定经常推荐。
有些品牌提及率不是最高,但一旦进入回答场景,就很容易被AI推荐。
这两类品牌的GEO问题完全不同。
第一类品牌的问题是:
被AI知道了,但还没有形成足够强的推荐理由。
第二类品牌的问题是:
一旦被AI想到,推荐效率很高,但基础提及覆盖还可以继续提升。
这就是AI推荐转化率的意义。
它可以帮助品牌判断自己当前处在哪个阶段:
- 高提及、高推荐:AI心智强,场景适配强
- 高提及、低推荐:AI知道你,但推荐理由不够强
- 低提及、高转化:AI想起你不多,但想起后容易推荐
- 低提及、低推荐:AI认知和推荐场景都需要建设
这比单纯看排名更有诊断价值。
六、案例结果:喜茶最容易被想起,瑞幸最容易被推荐
在本次“AI年轻人生活搭子指数”TOP10中,主要数据如下:
| 排名 | 品牌 | 综合指数 | 提及率 | 推荐率 |
|---|---|---|---|---|
| 1 | 瑞幸 | 64.90 | 73.06% | 60.50% |
| 2 | 喜茶 | 54.73 | 81.06% | 40.56% |
| 3 | 完美日记 | 50.66 | 71.17% | 39.61% |
| 4 | 优衣库 | 50.14 | 67.44% | 40.82% |
| 5 | 花西子 | 45.54 | 63.72% | 35.75% |
| 6 | 名创优品 | 45.05 | 61.55% | 36.16% |
| 7 | 蜜雪冰城 | 44.65 | 50.94% | 41.27% |
| 8 | 泡泡玛特 | 38.28 | 56.95% | 28.22% |
| 9 | 小米 | 34.78 | 54.72% | 24.04% |
| 10 | 麦当劳 | 33.62 | 39.78% | 30.30% |
这个结果里最值得分析的,不是简单的TOP10排名,而是几个指标之间的差异。
喜茶提及率达到81.06%,是TOP10中最高的。
这说明,在AI回答年轻人生活方式、茶饮、社交、悦己消费等问题时,喜茶非常容易被想起。
但瑞幸的推荐率达到60.50%,明显领先其他品牌。
这说明,AI不仅知道瑞幸,而且更容易把瑞幸作为具体建议输出。
用一句话概括:
喜茶是AI最容易想起的年轻人生活品牌,瑞幸是AI最容易推荐的年轻人生活搭子。
这其实就是GEO分析中非常典型的现象:
品牌可见度和品牌推荐强度不是同一个指标。
一个品牌可以被AI频繁提到,但推荐率未必最高。
一个品牌也可以不是提及率第一,但在具体问题中更容易被AI推荐。
七、为什么瑞幸推荐率更高?
从AI回答逻辑看,瑞幸的优势在于它和具体生活场景之间的连接非常清晰。
它常见的AI心智标签包括:
- 咖啡
- 提神
- 上班
- 通勤
- 性价比
- 高频消费
- 打工人日常
这些标签非常容易被AI放进具体问题里。
当用户问:
- 上班困了喝什么?
- 通勤路上买什么?
- 预算不高想喝咖啡怎么办?
- 打工人日常有什么小确幸?
AI很容易把瑞幸作为一个具体可执行的建议。
这说明,在GEO场景中,品牌想被AI推荐,不能只有知名度,还要有清晰的场景适配性。
换句话说,AI推荐一个品牌时,需要一个“为什么”。
如果一个品牌能够被一句话解释清楚:
“它适合什么人,在什么场景下,解决什么问题。”
那么它就更容易进入AI推荐答案。
八、为什么喜茶提及率更高?
喜茶的优势在于识别度和生活方式标签。
它常见的AI心智标签包括:
- 茶饮
- 社交
- 悦己
- 分享
- 朋友聚会
- 年轻生活方式
这类标签使它在AI回答年轻人生活方式问题时非常容易出现。
但提及率高不一定意味着推荐率最高。
因为AI可能会把喜茶作为一个代表性品牌提到,但在某些具体场景中,未必总是把它作为最强推荐答案。
这也说明,AI对品牌的处理存在至少两个层次:
第一层是识别:
这个品牌是否进入AI候选集合。
第二层是推荐:
这个品牌是否适合当前问题,并值得被明确建议。
GEO优化不能只做第一层,还要做第二层。
九、从推荐转化率看品牌GEO诊断
根据本次数据,可以计算部分品牌的AI推荐转化率:
| 品牌 | 提及率 | 推荐率 | AI推荐转化率 |
| 瑞幸 | 73.06% | 60.50% | 约82.8% |
| 蜜雪冰城 | 50.94% | 41.27% | 约81.0% |
| 麦当劳 | 39.78% | 30.30% | 约76.2% |
| 优衣库 | 67.44% | 40.82% | 约60.5% |
| 名创优品 | 61.55% | 36.16% | 约58.7% |
| 花西子 | 63.72% | 35.75% | 约56.1% |
| 完美日记 | 71.17% | 39.61% | 约55.7% |
| 喜茶 | 81.06% | 40.56% | 约50.0% |
| 泡泡玛特 | 56.95% | 28.22% | 约49.6% |
| 小米 | 54.72% | 24.04% | 约43.9% |
这个表比单纯排名更有分析价值。
比如,蜜雪冰城综合排名不是最高,但推荐转化率很强。这说明它在AI回答中的基础提及空间仍可提升,但一旦被纳入回答,就很容易被推荐。
麦当劳也是类似情况。它不是提及率最高的品牌,但推荐转化率较高,说明“快餐、补给、稳定、低决策成本”这类场景在AI推荐中有较强优势。
相反,喜茶提及率最高,但推荐转化率约50%。这并不是负面结果,而是说明喜茶在AI中的识别度很强,但从“被想起”到“被推荐”的转化仍有进一步提升空间。
从GEO角度看,不同品牌需要的优化策略不同:
- 喜茶这类高提及品牌,重点是强化具体推荐场景
- 蜜雪冰城这类高转化品牌,重点是提高更多问题中的基础覆盖
- 小米这类宽场景品牌,重点是明确在“年轻人生活搭子”语境下的核心场景
- 泡泡玛特这类情绪价值品牌,重点是绑定更具体的礼物、收藏、陪伴、兴趣场景
这才是AI心智指数真正的应用价值。
十、技术上如何搭建一个AI品牌心智评测系统?
如果从工程实现角度看,一个基础版AI心智评测系统至少需要五个模块。
1. 问题集生成模块
问题集是整个评测的基础。
一个好的问题集不能只包含关键词查询,而要覆盖真实用户可能向AI提出的自然语言问题。
问题可以按以下维度组织:
- 品类问题
- 场景问题
- 人群问题
- 预算问题
- 需求问题
- 对比问题
- 解决方案问题
例如:
- 年轻人上班困了喝什么?
- 适合朋友聚会的饮品有哪些?
- 新手化妆可以参考哪些品牌?
- 通勤穿搭有什么省心选择?
- 预算有限但想提升生活幸福感,有哪些品牌可以看?
问题集越接近真实用户语境,评测结果越有参考价值。
2. 多平台采集模块
GEO评测不能只看一个AI平台。
不同模型、不同产品、不同检索增强机制、不同安全策略,都会影响回答结果。
因此,采集模块至少要支持:
- 多AI平台
- 多轮独立请求
- 固定采集时间
- 问题去重
- 回答原文存档
- 异常重试
- 平台维度统计
这里要注意,独立提问非常重要。不能把同一个对话上下文连续问下去,否则前文信息会污染后续回答。
3. 品牌实体识别模块
采集到AI回答后,需要识别回答里出现了哪些品牌。
这一步看起来简单,实际很容易出问题。
常见问题包括:
- 品牌别名
- 中英文名称
- 缩写
- 错别字
- 同名实体
- 品牌和品类混淆
- 品牌和门店、产品线混淆
例如,一个品牌可能有中文名、英文名、简称、历史名称、产品名等多种表达方式。
如果不做实体归一,同一个品牌可能被拆成多个结果,导致榜单失真。
所以,品牌实体识别至少需要:
- 品牌词典
- 别名映射
- 正则匹配
- NER识别
- 人工审核
- 冲突消歧
- 实体归一
对于对外发布的榜单,实体归一非常关键。
4. 推荐意图识别模块
提到品牌不等于推荐品牌。
所以系统需要判断品牌在回答中的角色。
比如:
- 只是列举
- 作为例子
- 明确推荐
- 对比推荐
- 不推荐
- 风险提示
- 中性描述
简单做法是通过规则判断推荐词,例如“推荐”“可以考虑”“适合”“优先选择”等。
更稳的做法是结合大模型进行语义判定,让模型判断某品牌在回答中是否被推荐,以及推荐强度是多少。
推荐意图识别是区分提及率和推荐率的关键。
5. 指标计算与报告生成模块
最后需要将品牌在不同平台、不同问题、不同场景中的表现聚合成指标。
基础指标包括:
- 提及次数
- 提及率
- 推荐次数
- 推荐率
- 平台覆盖率
- 场景覆盖率
- 平均排名位置
- 推荐转化率
- 综合指数
进一步还可以扩展:
- 正向解释率
- 负向描述率
- 竞品共现率
- 场景关联强度
- 平台稳定性
- 回答波动率
- 品牌解释一致性
这些指标不仅可以做榜单,也可以做品牌诊断。
十一、GEO优化的核心不是“刷AI”,而是提升可理解性
很多人一听GEO,容易误解成“让AI强行推荐我”。
这个理解是错的,也不可持续。
真正的GEO不是操纵AI,而是提升品牌在公开信息生态中的可理解性、可信度和场景清晰度。
从本次案例看,AI更容易推荐的品牌,往往有几个共同特点:
第一,品牌定位清楚。
AI知道它是谁,知道它代表什么。
第二,使用场景明确。
AI知道它适合什么问题、什么人群、什么预算、什么场合。
第三,公开信息稳定。
官网、媒体、百科、社区内容、电商页面中的表达相对一致。
第四,推荐理由容易生成。
AI能够清楚说明为什么这个品牌适合当前问题。
第五,用户认知和内容生态形成重复验证。
大量公开内容都在不断强化同一类品牌标签。
这意味着,GEO优化的重点不是写一堆低质量内容,而是让品牌信息更结构化、更一致、更可被AI读取和解释。
十二、品牌在AI时代应该怎么做内容?
如果一个品牌希望提升AI回答中的出现概率和推荐概率,可以从四个方向入手。
1. 建立清晰的品牌实体信息
包括:
- 品牌名称
- 品牌别名
- 所属公司
- 所属品类
- 核心产品
- 目标人群
- 核心场景
- 品牌定位
- 官方资料页面
这些信息要尽量清楚、一致、可检索。
2. 建立场景化内容
不要只写“品牌理念”,而要写清楚:
- 什么人适合
- 什么场景适合
- 解决什么问题
- 和竞品有什么差异
- 适合什么预算
- 有哪些典型使用方式
AI更容易理解具体场景,而不是抽象口号。
3. 建立可信内容源
品牌内容不能只存在于广告页面里。
更完整的内容生态应该包括:
- 官网结构化介绍
- 媒体报道
- 行业内容
- 问答内容
- 用户评价
- 产品说明
- 案例内容
- 第三方介绍
AI在生成答案时,会综合多个信息来源。单一来源的自说自话,很难形成稳定心智。
4. 持续监测AI回答变化
AI回答不是固定的。
不同平台、不同时间、不同问题、不同上下文,都会导致结果变化。
所以GEO不应该是一次性工作,而应该变成持续监测:
- 每周或每月采集
- 观察品牌提及变化
- 观察竞品变化
- 观察负面描述
- 观察平台差异
- 观察新场景机会
- 观察内容优化后的效果
这也是AI心智指数类产品的长期价值。
十三、从这个案例看,AI心智评测还有哪些难点?
这类评测看似只是“问AI、统计品牌”,但实际有不少难点。
1. 问题集会影响结果
问题怎么设计,会直接影响最终榜单。
如果问题偏饮品,咖啡和茶饮品牌就会更占优。
如果问题偏穿搭,服饰品牌就会更占优。
如果问题偏数码,科技品牌就会更占优。
所以,对外发布报告时,必须说明问题集范围和研究边界。
2. AI回答存在波动
同一个问题,在不同时间、不同平台、不同上下文中,回答可能不同。
这就要求采集要足够独立,样本量要足够大,并且需要保存原始回答,方便复核。
3. 品牌实体归一很关键
一个品牌如果有多个写法,系统必须归一,否则会出现同一品牌被拆成多个结果的问题。
这在真实榜单中非常常见。
4. 推荐意图判断不能只靠关键词
“提到”不等于“推荐”。
有些回答可能是:
- “不建议选择某品牌”
- “某品牌争议较多,需要谨慎”
- “可以对比A和B”
- “如果追求低价可以考虑A,如果追求品质可以考虑B”
这类语义判断需要更精细的分类。
5. 综合指数需要透明
如果综合指数过于黑箱,用户很难相信结果。
所以,一个可靠的AI心智指数产品,应该尽量解释指标构成、计算逻辑和数据边界。
十四、结语:AI回答正在成为新的品牌分发层
这次“AI年轻人生活搭子指数”的意义,不只是发现瑞幸综合第一、喜茶提及率第一,也不只是讨论哪个品牌更受AI推荐。
更重要的是,它展示了一种新的评测方向:
把AI回答本身当作一个新的信息分发层来测量。
过去我们测搜索排名,测内容曝光,测点击率,测转化率。
现在,我们还需要测:
- 品牌是否进入AI答案
- 品牌在AI答案中处于什么位置
- 品牌是否被明确推荐
- 品牌被推荐的理由是否准确
- 品牌和哪些场景绑定
- 品牌在不同AI平台中的表现是否稳定
- 品牌和竞品在AI回答中如何共现
这就是GEO时代的品牌可见度评测。
未来,用户会越来越多地通过AI获取建议。
品牌也会越来越多地面对一个新问题:
当用户问AI“我该选什么”时,AI会不会想到你?
这个问题,值得所有做品牌、做内容、做搜索、做AI应用和做数据评测的人认真研究。