横轴是 AI 主动推荐你的概率,纵轴是 AI 对你的信息答对的比例(与百度百科一致的占比)。被看见,和被说对,是两件独立的事。把光标移到任意一点,读出它在两个维度上的坐标。
200 个品牌,覆盖 17 个行业。评测平台:三个主流 AI 搜索平台(均开启联网搜索模式)。评测时间:2026 年 6 月。
2,842 道不含品牌名的消费决策问题,覆盖推荐、对比、场景、功能、价位、人群六种提问类型。每个品牌按子品类标注关联问题,分母为该品牌的相关问题数,而非行业全部问题数。样本上也按品类、子品类对品牌做了扩充——品类内品牌过少,AI 的可选池就太小、提及率会失真,铺到足够密度才测得准。所有问题经三轮自动质检:品牌泄漏检测、隐性导向检测、覆盖度检测。品牌识别采用三层防护:别名分级、排除模式、抽样校验。随机抽取 30% 问题重复查询验证稳定性,品牌提及重合度 ≥ 85%。
从公开信息提取 3,986 个信息单元(IU),覆盖年份、地名、人名、机构名、数字、描述六种事实类型,采用 NLP 领域事实核验标准方法(IU 法)逐条比对。题目按检索难度分为 L1(基础事实,如总部、创始人)、L2(需一定检索深度,如某年排名)、L3(细节数字,如注册资本)三个层级,难度分级用于分层分析。评分采用精准匹配 / 包含匹配 / 不匹配三档制(分别记满分、半分、零分),中英文对照、缩写还原等情况另有 AI 语义判断兜底。三平台得分等权平均,得到 0–100 的综合准确率,越高表示与百度百科越一致。
本次评测以百度百科作为准确度参照基准。这并非品牌官方授权数据,百度百科本身可能存在信息滞后或不准确。因此评测结果反映的是 AI 回答与百度百科的一致性,而非品牌信息的绝对准确度——某个品牌落在分歧区,可能是 AI 表述有误,也可能是百度百科与品牌实际情况存在出入。
本评测为探索性实验研究,基于特定时间窗口的数据快照。AI 平台联网搜索依赖实时互联网内容,不同时段查询结果可能存在差异。提及度反映 AI 的推荐倾向,不代表消费者实际购买行为。准确度为三平台原始答对率的等权平均(0–100,对标百度百科),跨行业比较需结合行业上下文解读。本研究是一次方法论探索——用一套可复制的框架,去丈量一个此前未被系统丈量过的领域,必有不完美之处,我们会在后续迭代中持续优化。欢迎业界交流探讨。