Generative-Summaries-for-Search-Results-scaled.

Google 生成式搜索结果专利解读

Google专利 US11769017B1 深度解析与优化指南
Google Patent • US11769017B1

搜索结果的生成式摘要
Generative Summaries for Search Results

这项Google专利揭示了AI搜索摘要(如Google SGE / AI Overviews)背后的核心架构——如何用大语言模型从搜索结果中生成准确、个性化、可验证的自然语言摘要。本指南将深度拆解其技术原理,并提供可操作的页面与文章优化教程。

专利号US11769017B1
授权日2023-09-26
受让人Google LLC
状态有效 (Active)
被引用95次
01

这项专利到底在解决什么问题?

背景问题

传统LLM生成搜索摘要的三大缺陷

Google在专利中明确指出,直接用LLM回答搜索查询存在根本性缺陷:

  1. 不准确(Inaccuracy):LLM的训练数据可能过时或本身就不准确。例如,用户搜索”如何修改Acme路由器DNS”,LLM回答”默认IP是192.168.1.1″,但这个信息可能已经过时。
  2. 过度指定(Over-specification):对已经了解基础知识的技术用户,给出包含过多基础信息的冗长回答,浪费带宽和用户时间。
  3. 指定不足(Under-specification):对新手用户,给出过于简略的回答,导致用户需要进行更多交互才能获取完整信息。

核心洞察:同一查询”如何修改路由器DNS”,第一次由技术小白提交,第二次由资深工程师提交。传统LLM对两次提交生成完全相同的回答——这在搜索场景下是不可接受的。本专利的解决方案是:引入”额外内容”(Additional Content)增强LLM输入,使生成的摘要既准确又适配当前用户。

02

系统架构全景图

FIG. 1 — NL Based Response System 架构
📱
客户端设备 110
用户输入引擎 111
渲染引擎 112
上下文引擎 113
隐含输入引擎 114
应用程序 115
🧠
NL响应系统 120
SRD选择引擎 122
LLM选择引擎 132
LLM输入引擎 134
响应生成引擎 136
链接化引擎 138
置信度引擎 140
交互引擎 142

三大核心子系统

  • 客户端设备(Client Device 110):不仅是输入输出终端。上下文引擎会分析当前上下文(位置、历史查询、用户画像),隐含输入引擎甚至能自动生成查询(无需用户输入)。
  • NL响应系统(Response System 120):核心大脑。包含7个引擎协同工作——从选择搜索文档,到构造LLM输入,到生成摘要、添加链接、评估置信度,再到根据用户交互修订摘要。
  • 搜索系统(Search System 160):负责索引、检索、排名。为NL响应系统提供搜索结果文档及其特征度量。
03

核心流程详解(FIG. 2 — Method 200)

生成式搜索摘要的主流程
接收查询
Block 252
选择查询相关SRD
Block 254
选择关联查询SRD
Block 256
选择近期查询SRD
Block 258
LLM生成摘要
Block 260
渲染+链接化
Block 262
流程拆解

六步生成高质量AI摘要

1

接收查询(Block 252)

支持多种输入类型:文字输入、语音输入(ASR转文字)、图像查询、多模态查询(如拍一张牛油果照片+语音”这个健康吗”→转为”牛油果健康吗”),以及隐含查询(系统自动生成,无需用户输入)。

2

选择查询相关SRD(Block 254)

从搜索结果中选择一个子集。选择依据三类度量:查询依赖度量(排名、点击率、地域匹配、语言匹配)、查询无关度量(整体可信度、热度、新鲜度)、用户依赖度量(与用户画像的关联性)。同一查询在不同地区提交,会选择不同的SRD。

3

选择关联查询SRD(Block 256,可选)

找到与原始查询相关联的查询(”相关搜索”),并获取这些关联查询的搜索结果文档。关联度基于:同一设备或账户在时间上近距离发出两个查询的频率。只在主查询的SRD质量不高或多样性不足时执行。

4

选择近期查询SRD(Block 258,可选)

获取用户最近搜索过的查询的搜索结果文档。在近期查询与当前查询有主题重叠时执行,为摘要提供连续性上下文。

5

LLM生成摘要(Block 260)

将选定SRD的内容(文本、图片说明、视频转录等)作为额外内容输入LLM。两种Prompt模式:
"Summarize <Content A>, <Content B>, <Content C>"(不含查询本身)
"In the context of <query>, summarize <Content A>, <Content B>..."(含查询上下文)

6

渲染摘要(Block 262)

摘要配合链接化内容(Sub-block 262A)、置信度标注(Sub-block 262B)一起渲染。根据整体置信度,决定是仅展示摘要、摘要+搜索结果,还是直接不展示摘要只给搜索结果。

04

SRD选择机制:你的页面如何被选中

关键发现

三类度量决定你的页面能否被AI摘要引用

度量类型具体指标对优化的启示
查询依赖度量排名位置、点击率、地域匹配、语言匹配传统SEO排名仍然是基础;做好本地化
查询无关度量整体点击率、可信度(作者/域名/入链)、热度、新鲜度建设域名权威;持续更新内容保持新鲜
用户依赖度量与用户画像属性的关联、与近期查询的关联内容覆盖多层次受众(新手到专家)

实操要点:专利明确提到”可信度(trustworthiness)”基于作者身份、域名声誉和入站链接。这与Google的E-E-A-T框架高度一致。要想被AI摘要引用,E-E-A-T建设不是可选项,而是必选项

SRD 内容处理流水线(Block 260A)
提取SRD内容
文本/图片/视频
内容筛选
与查询相关的子集
可选: 预摘要
缩短以适应上下文
添加源标识
S1, S2, S3…
送入LLM
生成最终摘要
05

链接化与置信度系统

google.com/search?q=植物性饮食的健康益处
🔍 植物性饮食的健康益处

研究表明,植物性饮食可以显著降低心脏病、糖尿病和肾病的发病率S1S2。富含蔬菜、水果和全谷物的饮食还有助于改善肠道微生物群平衡S3,从而增强免疫功能。

healthline.com
植物性饮食入门指南
完整的植物性饮食指南,包含营养建议、食谱推荐…
mayoclinic.org
植物性饮食与慢性病预防
Mayo Clinic 对植物性饮食与心血管健康关系的综述…

链接化流程(FIG. 3 — Method 300)

系统对摘要的每个部分进行验证,为已验证的部分添加可点击链接:

  1. 基于LLM输出中的源标识符:LLM生成时在内容后附加 S1、S2 等标记,表明该段内容来源于哪个SRD。
  2. 基于嵌入向量比较:用编码器将摘要片段和SRD内容分别生成嵌入向量,计算距离。距离在阈值内,则认为该SRD验证了该片段。

置信度标注系统

系统为摘要的每个部分和整体计算置信度分数:

🟢 高置信度 — 绿色标注
🟡 中置信度 — 橙色标注
🔴 低置信度 — 红色标注

置信度决定展示策略:

置信度展示策略
高于上限阈值仅展示AI摘要,搜索结果初始隐藏
在上下限之间同时展示AI摘要和搜索结果
低于下限阈值完全不展示AI摘要,只展示传统搜索结果

对内容创作者的警示:如果你的内容不够可信,AI摘要可能根本不会引用你。更糟的是,如果整个查询领域的SRD可信度都不高,Google可能完全不展示AI摘要。可信度建设是进入AI搜索时代的门票。

06

交互式摘要演进

FIG. 4 — 摘要演进流程
初始摘要生成
Block 454
渲染摘要+链接
Block 456
监测用户交互
Block 458
生成修订摘要
Block 460
渲染修订摘要
Block 462
初始摘要

“首先在浏览器输入路由器IP,默认IP是192.168.1.1。然后输入用户名和密码,默认为admin和admin。最后选择高级设置选项卡,找到DNS设置。”

用户阅读了IP和登录页面后 → 修订摘要

“登录路由器后,选择高级设置选项卡,DNS设置在顶部。DNS设置区域包含一个自由输入字段,你可以在其中输入首选DNS信息。”

修订摘要的两种实现方式

  • 同一LLM + 修订Prompt:将初始Prompt从”总结以下内容”改为”假设用户已知X,总结以下内容”,其中X是用户已浏览SRD的内容描述。
  • 专用微调LLM:使用专门在”已知内容+待总结内容”格式上微调过的模型,接收已知部分和新内容作为分隔输入。

优化启示:你的页面如果被用户点击阅读,AI摘要会根据你页面的内容来调整后续摘要。你的页面内容越专深、越有独特价值,就越可能影响AI摘要的后续演化方向。确保页面有足够深度来”改变对话”。

07

用户画像与个性化(FIG. 6)

基于用户熟悉度的摘要个性化

系统根据用户画像判断用户是否已经熟悉查询相关的某些内容,然后调整LLM输入:

新手用户 → 无熟悉度假设

Prompt: "回答 [查询]"
"总结 [SRD内容]"
→ 生成完整、入门级的摘要

熟悉用户 → 含熟悉度假设

Prompt: "假设用户已熟悉 [内容描述],回答 [查询]"
→ 跳过基础内容,直达深层信息

判断用户熟悉度的依据:设备画像、用户账号画像、历史交互过的SRD、以及画像中直接标明的熟悉领域。

08

多模型协作策略(FIG. 5)

动态选择生成模型

系统根据查询类型动态选择模型组合:

📊

信息型LLM

微调于摘要Prompt,用于生成事实性信息摘要。适合”如何做”、”什么是”类查询。

✍️

创意型LLM

微调于创意生成Prompt,用于生成诗歌、散文或创意写作。适合”写一首关于…”类查询。

🎨

文生图扩散模型

根据查询生成合成图像。当分类器判断查询需要视觉回答时启用。

并行策略:多个LLM同时处理同一查询,各自生成候选摘要,选择最佳的一个。
串行策略:第一个LLM选择段落→第二个LLM对各段落生成摘要→第三个LLM合成最终摘要。

09

页面优化实战指南:让AI摘要选中你

🏗️

1. 结构化内容布局

AI系统会从你的页面中提取”对应内容”。使用清晰的H2/H3层级、段落分明的结构,使系统能高效定位与查询相关的内容片段。

📐

2. 提供可提取的精华段落

专利提到系统会选择”内容的子集”送入LLM。在每个小节开头提供2-3句精炼的核心观点,方便系统提取。

🔗

3. 强化可验证性

链接化引擎通过嵌入向量比较验证摘要。确保你的内容中有事实性、可引用的陈述,而非含糊的表述。

🌡️

4. 保持内容新鲜度

“新鲜度度量”是SRD选择指标之一。定期更新内容、添加最新数据和案例。

🌍

5. 地域与语言适配

“地域度量”和”语言度量”是查询依赖指标。对目标市场做内容本地化,使用hreflang标签。

🖼️

6. 多媒体内容优化

系统会处理图片说明、视频转录文字。为每张图片提供描述性alt文本和caption,为视频提供字幕/转录。

页面速度与技术基础

A

确保页面可抓取、可索引

如果Googlebot无法抓取你的页面,搜索系统根本无法将其纳入SRD候选。检查robots.txt、meta robots、canonical标签。使用SSR或预渲染确保JS内容可被抓取。

B

优化Core Web Vitals

用户停留时间在专利中被明确作为交互信号。页面加载慢会降低停留时间,间接降低用户依赖度量。LCP < 2.5s, INP < 200ms, CLS < 0.1。

C

移动端优先

专利中的示例客户端设备(FIG. 7)是手机。确保移动端体验优秀:响应式设计、触摸友好、阅读舒适。

10

文章内容优化教程:写出被AI引用的文章

写作框架

基于专利机制的内容创作七步法

1

直接回答用户查询

LLM的输入包含查询本身和你的内容。确保文章在前200字内直接、明确地回答目标查询。避免铺垫式写法,直接给出答案。

2

覆盖关联查询的内容

系统会选择”关联查询”的SRD(Block 256)。研究目标查询的”相关搜索”和”People Also Ask”,在文章中覆盖这些关联话题。

3

提供独特、权威的事实性陈述

链接化引擎会将摘要片段与你的内容做嵌入向量比对。包含具体数据、研究引用、原创洞察——这些在向量空间中与AI摘要的特定片段产生高度匹配。

4

分层深度:从入门到专家

个性化系统(FIG. 6)会根据用户熟悉度调整摘要。用清晰的H2/H3结构,从基础概念到深度分析分层组织,让系统能为不同用户提取不同层次的内容。

5

用结构化格式呈现关键信息

专利提到用户可以指定格式偏好(列表、图表等)。在文章中混合使用列表、表格、步骤、对比——更容易被系统识别并嵌入AI摘要。

6

建立作者和域名权威

可信度度量基于作者身份、域名声誉和入站链接。每篇文章标明具有专业资质的作者,在作者简介页展示资质和成就。

7

优化多媒体并添加描述

系统处理的内容包括图片(自动生成的标题、OCR文字、物体描述)和视频(音频转录)。为每个视觉元素提供详细的alt属性、说明性caption、视频字幕文件。

反面示例

标题:关于路由器你需要知道的事

“路由器是一种网络设备。它有很多功能。下面我们来讨论一下如何使用路由器…”

问题:没有直接回答查询、缺乏事实数据、无分层结构。

正面示例

标题:如何修改Acme X200路由器DNS设置(2024年更新)

修改DNS只需3步:① 浏览器访问 192.168.0.1 ② 用admin/admin登录 ③ 在’网络设置→DNS’中输入首选DNS地址…”

直接回答、含具体数据、结构清晰。

11

结构化数据与Schema标记

通过Schema帮助系统理解你的内容

虽然专利没有直接提到Schema.org,但其描述的”特征引擎”和”度量数据库”需要理解页面内容的结构和属性。结构化数据是帮助搜索系统理解你内容的最直接方式。

// Article Schema — 标明文章的作者、发布日期、修改日期 <script type="application/ld+json"> { "@context": "https://schema.org", "@type": "Article", "headline": "如何修改路由器DNS设置", "author": { "@type": "Person", "name": "张工程师", "url": "https://example.com/author/zhang" }, "datePublished": "2024-01-15", "dateModified": "2024-12-01" } </script>
// HowTo Schema — 步骤型内容特别适合被AI摘要引用 <script type="application/ld+json"> { "@context": "https://schema.org", "@type": "HowTo", "name": "修改路由器DNS设置", "step": [ { "@type": "HowToStep", "name": "访问路由器管理页面", "text": "打开浏览器,输入 192.168.0.1" }, { "@type": "HowToStep", "name": "登录管理界面", "text": "输入用户名和密码" } ] } </script>
// FAQPage Schema — 覆盖关联查询 <script type="application/ld+json"> { "@context": "https://schema.org", "@type": "FAQPage", "mainEntity": [{ "@type": "Question", "name": "修改DNS后网速会变快吗?", "acceptedAnswer": { "@type": "Answer", "text": "使用更快的DNS可以..." } }] } </script>
12

SEO优化检查清单

完整检查清单

针对AI搜索摘要的页面与文章优化要点

  • 内容直接回答目标查询 — 前200字内给出明确答案
  • 包含事实性、可引用的数据 — 具体数字、研究引用、日期
  • 覆盖关联查询 — 研究”相关搜索”和”PAA”并在文章中覆盖
  • 分层深度结构 — 从入门到专家,用H2/H3层级组织
  • 使用结构化格式 — 列表、表格、步骤、对比
  • 内容新鲜度 — 定期更新,页面显示”最后更新”日期
  • 作者权威性 — 标明有专业资质的作者,链接到作者简介页
  • 域名可信度 — 建设高质量入站链接,保持域名良好声誉
  • 多媒体描述 — 图片alt文本、caption说明、视频字幕完整
  • Schema结构化数据 — Article、HowTo、FAQPage等标记完整
  • 地域和语言适配 — hreflang标签、内容本地化
  • 技术基础健全 — 可抓取、可索引、CWV达标、移动端友好
  • 用户参与度 — 页面停留时间、点击深度信号良好
  • 独特价值 — 提供原创洞察和独特观点,而非重复已有内容

最终建议:这项专利揭示了一个核心逻辑——Google的AI搜索摘要并非凭空生成,而是以搜索结果文档为锚点,用LLM进行总结和增强。传统SEO(排名、权威性、内容质量)仍然是基础,但现在你还需要确保内容的可提取性、可验证性和多层次深度。AI搜索时代的赢家,是那些同时满足搜索引擎和LLM需求的内容创作者。

Related Articles

EVA 模型是什么?

E.A.V 语义SEO完全教程 Semantic SEO Tutorial 理解  Entity  Attribute  Value 从零开始掌握语义SEO的核心模型 —— 让搜索引擎真正”读懂”你的内容 Part 01 什么是 E.A.V 模型? E.A.V 是搜索引擎理解世界万物的基本方式。把它想象成给每个”事物”建立一张信息卡片。 🏷️ Entity 实体 指的是一个明确的”事物”——可以是人、地点、品牌、产品、概念等 🔍 Attribute…

EAV 模型在 SEO 中的作用

Attribute Filtration 属性筛选深度教程 Semantic SEO 深度教程 属性筛选三准则Attribute Filtration页面优化与文章写作实战 从 EAV 模型到 Topical Map,掌握语义 SEO 中属性筛选的三大标准——显著性、流行度、相关性,并通过完整案例学会如何在真实页面与文章中落地。 基础概念 EAV 模型 三大筛选标准 案例:签证站 案例:电商站 案例:博客站 页面优化 文章写作 Topical…

如何设置Google Seach Console

以第一种方法举例,通过DNS Verification 方法进行验证 点击Add New Record,选择添加TXT Record 记录, 创建好TXT Record 记录后,在Host对应位置填入你的域名信息,在Value位置填入Google Serach Console 提供的 TXT Record 记录,把那个记录复制到这里,TTL 这个保持不变,然后点击保存信息。

Google 语义搜索专利解读与页面SEO优化实战指南

Google专利解读:语义搜索查询优化完全指南 US8055669B1 · Google LLC Google 语义搜索专利解读与页面SEO优化实战指南 深入解析 Google 如何通过语义概念向量改进搜索查询,并将专利核心思想转化为可执行的页面优化与内容创作策略。 专利号 US8055669B1 申请日 2003-03-03 授权日 2011-11-08 发明人 Amit Singhal 等 目录导航 01 专利核心思想总结 02 系统架构图解…

Google多阶段查询处理 SEO实战教程

Google多阶段查询处理 SEO实战教程 SEO 专利解读 · 汽车配件实战案例 Google 多阶段查询处理SEO优化实战教程 基于 Google 专利 US 20060036593,深入拆解搜索引擎从接收查询到返回结果的四个阶段,并用汽车配件行业案例演示每个阶段的页面优化策略。 核心原理 阶段一:词元处理 阶段二:邻近度 阶段三:属性分析 阶段四:摘要生成 完整案例 自查清单 核心原理 Google 如何分四步找到最相关的页面 Google 在…

Responses

Your email address will not be published. Required fields are marked *