超越关键词:实体如何影响现代 SEO 策略
已发表: 2023-07-06从“搜索引擎2.0”到“搜索引擎3.0”的转变带来了重大变化,特别是实体的引入。
本文探讨了这些转变、实体对现代 SEO 的影响,以及如何调整您的策略以在这个新时代蓬勃发展。
构建您自己的 SEO“概念机器”
在我学习编码的早年,一位老师引入了一个有影响力的概念,称为“概念机器”,它重塑了我的编程方法以及后来的 SEO 方法。
简而言之,它是开发人员单击“运行”时计算机内部发生的情况的近似心理模型。
我的老师强调,这种心理表征越详细、越准确,我就越有能力解决新问题。
最成功的程序员是那些开发了最准确、最可靠的概念机器的人!
与 SEO 类似,当我们吸收新概念、研究案例研究或观察变化的影响时,我们正在不断更新搜索引擎如何工作的心智模型(我们自己的概念机器)。
熟练的 SEO 和不熟练的 SEO 之间的区别在于,他们可以推动结果,因为他们可以从更准确的模型中提取解决方案。
安德森爱立信在专业领域进行的研究提供了大量证据来证实这一点。
他对专业知识的研究表明,那些在各自领域表现出色的人拥有卓越且更容易理解的思维模式。
这些模型使他们能够理解错综复杂的因果关系,区分复杂场景中真正重要的事情,并感知并不立即显现的潜在过程。
随着实体搜索引擎优化的引入,谷歌搜索引擎中的几个主要组件发生了变化。
看来许多 SEO 专业人士仍然在“搜索引擎 2.0”的规则下操作,尽管“搜索引擎 3.0”现在遵循一套略有不同的规则。
实体 SEO 引入了源自机器学习和信息检索学科的词汇和概念。
这些术语可能看起来很复杂,因为它们尚未简化为其核心含义。 一旦我们将它们提炼出来,你就会发现这些概念并不太复杂。
我的目标是构建一个简单而有效的概念机器,说明最新的搜索引擎如何使用实体。
更具体地说,我想说明您对 SEO 的理解需要如何更新以反映这一新现实。
虽然理解这些变化背后的“原因”似乎并不重要,但许多 SEO 专业人士利用他们对 Google 如何解释网络的理解,有效地“破解了矩阵”。
近年来,人们已经建立了数以百万计的访问者网站,并通过操纵这些概念改变了谷歌对主题的理解。
复习:我们如何实现搜索引擎 2.0
在探究“搜索引擎2.0”和“搜索引擎3.0”的区别之前,我们先回顾一下相对于最初的1.0版本的核心变化。
最初,搜索引擎以简单的“词袋”模型运行。
该模型将文档仅视为单词的集合,忽略了这些单词的上下文含义或排列。
当用户进行查询时,搜索引擎将引用倒排索引数据库(一种将单词映射到其在一组文档中的位置的数据结构)并检索匹配次数最多的文档。
然而,由于缺乏对文档和用户查询的上下文和语义的理解,该模型通常无法提供相关且精确的搜索结果。
例如,如果用户使用“词袋”模型搜索“jaguar”,搜索引擎将简单地提取包含“jaguar”一词的文档,而不考虑上下文。
无论用户的意图如何,这都可能产生有关捷豹汽车品牌、捷豹动物甚至杰克逊维尔捷豹橄榄球队的结果。
随着“搜索引擎2.0”的出现,谷歌采取了更复杂的策略。 这次迭代不仅仅是匹配单词,而是旨在破译用户查询背后的意图。
例如,如果用户搜索“jaguar”,引擎现在可以考虑用户的搜索历史和位置来推断可能的上下文。
如果用户一直在搜索汽车模型或居住在捷豹汽车流行的地区,则引擎可能会优先考虑有关汽车品牌的结果,而不是动物或足球队的结果。
引入个性化搜索结果(考虑用户历史记录和位置等因素)显着提高了搜索结果的相关性和精确度。 这标志着从基本的“词袋”模型到“搜索引擎2.0”的重大演变。
搜索引擎 2.0 与 3.0
当我们从“搜索引擎1.0”过渡到“搜索引擎2.0”时,我们必须更新我们的思维模型并改变我们的做法。
反向链接的质量变得至关重要,促使 SEO 专业人员放弃自动反向链接工具,转而从更高质量的网站寻求反向链接,其中包括一些关键变化。
在“搜索引擎3.0”时代,显然,适应这些变化的思维转变仍在进行中。
2.0时代的许多概念仍然存在,很大程度上是因为实践者需要时间来观察他们的调整与后续结果之间的相关性。
相当多的 SEO 专业人士尚未完全适应这些重大变化,或者他们可能已经尝试这样做,但尚未完全达到目标。
为了阐明这些新的区别并为修改方法提供指导,我将展示“搜索引擎 2.0”和“搜索引擎 3.0”的过度简化但有用的比较。
查询处理和信息检索
想象一下在 Google 中输入搜索查询“Elvis”。
在 Google 搜索引擎 2.0 时代,底层算法的复杂性使得人们能够理解查询背后的用户意图,而不仅仅是匹配关键字。
例如,如果用户搜索“Elvis”,系统将使用自然语言处理和机器学习来理解和预测查询背后的意图。
它将在索引中查找“Elvis”,并返回提及“Elvis”一词的结果,或者返回(几乎完全)基于网页上的文案相关性以及用户历史记录和位置等个性化参数的结果。
然而,该模型仍然有其局限性,因为它在很大程度上依赖于关键字、用户搜索历史记录、索引网页文本中的位置和短语。
“Elvis” 的上下文可能指 Elvis Presley、Elvis Costello,甚至是当地一家名为“Elvis”的餐厅。
挑战在于它在很大程度上依赖于用户指定和细化他们的查询,并且仍然受到关键字语义的限制。
3.0 中的查询处理改进
许多人尚未意识到实体的引入如何从根本上彻底改变了搜索的工作方式。
自 2012 年以来,Hummingbird 和 RankBrain 为实体发挥更核心的作用铺平了道路。
在这个 3.0 模型中,实体指的是独特且独特的概念或事物,无论是人、地点还是物体。
使用我们之前的例子,“Elvis”不再只是一个关键字,而是被识别为一个实体,可能指的是著名音乐家埃尔维斯·普雷斯利。
例如,当识别出“埃尔维斯·普雷斯利”这样的实体时,搜索引擎现在可以将大量属性与该实体相关联,包括他的音乐、他的电影作品以及他的出生和死亡日期等方面。
这种新方法显着扩大了搜索范围。 以前,对“Elvis”的查询可能主要考虑大约 2,000,000 个包含确切关键字“Elvis”的页面。
现在,在这个以实体为中心的模型中,搜索引擎超越了这一点,考虑与猫王属性相关的任何页面。
这可能会扩大搜索范围,包括 10,000,000 个页面,即使其中一些页面没有明确提及“Elvis”。
此外,该模型允许搜索引擎了解与猫王实体属性相关的其他关键字,例如“Graceland”或“Blue Suede Shoes”,都隐式连接到“Elvis”。
因此,搜索这些术语也可能会带来有关猫王的信息,从而扩大潜在搜索结果的网络。
获取搜索营销人员信赖的每日新闻通讯。
查看条款。
搜索引擎3.0中的查询处理和主题边界
这些对查询处理中实体的改进带来的另一个重大转变是 Google 如何看待应驻留在单个页面上的主题范围。
在“搜索引擎2.0”时代,为每个识别的关键字创建单独的页面是有利的,这样页面就可以专门针对该术语进行优化。
然而,在“搜索引擎3.0”中,边界变得更加流动,并根据机器学习预测和观察到的用户行为实时更新。
在这个新时代,主题的界限可以是广阔的,也可以是狭窄的,可以涵盖广泛的主题,也可以集中于某一特定方面。 这种灵活性使网站能够成为广泛领域和利基领域的权威。
例子
考虑蜡笔的例子。 一个网站可能旨在涵盖有关蜡笔的所有知识——它们的历史、类型、制造过程、使用技巧等。
该网站旨在成为“蜡笔”整体的话题权威。
另一方面,另一个网站可能只关注红色蜡笔——它们独特的颜料、流行统计数据、文化意义等等。
该网站试图在较小的背景下建立其话题权威,但仍然有效。 然而,至关重要的是,对“红色蜡笔”的关注与网站的总体目的保持一致。
添加与您网站的更广泛目的不匹配的微观上下文可能会让 Google 对您网站的相关性和权威性感到困惑,从而可能削弱其主题权威。
理论上,网站甚至可以进一步深入研究微观环境,并将其内容仅集中在“红色蜡笔上使用的标签”上。
这是一个令人难以置信的具体焦点,人们可能想知道谷歌是否会承认它是一个话题权威。
社交媒体网站使用机器学习来预测用户与特定主题相关内容项的交互。
如果用户经常与有关“红色蜡笔上使用的标签”的内容进行交互,系统可能会将其识别为用户感兴趣的主题,并且提供该内容的网站可能会被视为该主题的权威。
从理论上讲,谷歌可以做类似的事情,或者至少根据他们跟踪的用户指标维持对好内容应该表现如何的期望。
为了确定这一点,Google 考虑了几个因素:
围绕该主题是否存在大量搜索活动?
如果人们正在积极搜索有关“红色蜡笔上使用的标签”的信息,并且该网站提供了有关该主题的全面且有价值的内容,那么它很可能被认为是该微观背景下的主题权威。
有好的用户指标吗?
如果用户在网站上花费很长时间,跳出率较低,并表现出其他参与迹象,Google 可能会将其解释为该网站在该主题上的权威标志。
请记住,话题权威是一个基于不同主题(实体)相对性的概念。 您的网站可以被视为主题权威,涵盖的主题范围广泛如“技术”或狭窄如“老式打字机”。
关键因素是您的网站表现出积极的用户行为,并有效地利用实体在内容内建立关系。 通过这样做,谷歌开始依靠您的网站来增强自己对主题的理解,而不管该主题的整体搜索量如何。
SEO 应用和要点
内容更全面更胜
在以前的版本中,许多网页在查询时被忽略,因为它们不包含搜索中包含的确切单词。
例如,不包含特定搜索词的链接良好的页面不会出现在结果中,无论其其他强大的排名因素如何,例如用户参与度和反向链接。
这鼓励搜索引擎优化编写更少的更有针对性的内容来实现目标关键词的排名。
然而,随着 3.0 的出现及其对理解实体及其关系的关注,游戏规则发生了变化。
这与确切的搜索词是否出现在页面上无关。 Google 现在将搜索您页面上的相关实体,并尝试将这些实体链接到整个网站上的相关实体。
然后它将确定近似相对论并相应地对您进行排名。 这种根本性的转变使具有强大排名因素的页面进入竞争,即使它们缺少特定术语
内容创建者和 SEO 策略师的关键要点是倾向于创建更全面和更广泛的内容。
将反向链接工作集中在这些广泛、深入的文章上,而不是将主题分散在多篇狭隘的文章中。
使用当前的 SERP 作为起点来识别重要主题,但不要受其限制。
旨在超越 SERP 中现有的主题覆盖范围,并为用户提供有价值的、全面的内容。
这将满足用户现有的查询和他们可能有的潜在相关查询,最终提高您的内容在这个新搜索时代的相关性和可见性。
回答意图而不是关注关键词的使用,要小心标题
在“搜索引擎3.0”时代,SEO策略已经演变。 仅仅将 Search Console 报告中的关键字插入到您的内容中并希望提高排名已经不够了。
谷歌的先进算法现在可以检测何时断章取义地使用关键字,这可能会混淆算法并可能导致排名下降。
标头顺序很重要
用你的大脑将与你的页面目标最相关的关键想法联系起来。 确保标题下的内容与标题的主题相匹配。
还记得小学写作课上头脑风暴的日子吗?
我们会画出圆圈,在圆圈内写下主题,然后通过画一条直线将它们连接到具有与我们的故事相关主题的较小圆圈。
不要让事情过于复杂化。 也可以使用这个策略来形成你的标题。
简而言之,“搜索引擎3.0”需要对关键字使用采取更周到的方法,解决用户意图并维护上下文,以提高相关性和排名潜力。
对文档进行评分和排名
一旦像谷歌这样的搜索引擎获取了潜在的相关文档,下一个关键步骤就是对这些页面进行评分并对它们进行排名以供用户选择。
人工智能 (AI) 和自然语言处理 (NLP) 的发展极大地改变了文档的排序方式,标志着 2.0 和 3.0 时代的明显区别。
2.0时代(后词袋,前RankBrain)
在2.0时代,Google的评分系统主要由PageRank、Hummingbird、Panda和Penguin等算法驱动。
这些算法严重依赖关键字匹配和反向链接数量来对文档进行排名。 每个文档都会根据页面获得分数,并根据排名顺序进行排序。
像 Panda 和 Penguin 这样的算法演变并不是为了摆脱关键字匹配,而是为了惩罚试图欺骗系统的网站。
基于关键字的系统仍然更高效,并且硬件不够先进,无法通过进化的语言方法提供快速搜索结果。
搜索引擎3.0时代的评分与排名
在“搜索引擎 3.0”领域,Google 对文档进行评分和排名的方法已经发生了显着的变化。
这是软件和硬件改进的结果。 Google 根据几个关键因素评估页面是否适合搜索查询。
关键区别在于量化相关性的能力得到提高,而不是依赖反向链接等外部信号来识别最佳内容片段:
事实准确性
来自信誉良好的来源的事实准确的内容继续排名更高。 谷歌的知识信托证实了这一点,并指出:
“我们将计算出的可信度分数称为基于知识的信任 (KBT)...对结果子集的手动评估证实了该方法的有效性。
用户交互信号
由于这些原因,“现在发布低质量内容并稍后编辑”策略可能会出现问题。 谷歌现在会考虑与网页相关的历史和当前用户参与度数据。
谷歌名为“基于参与度和体验的排名”(US20140244560A1)的专利概述了这种转变,该专利强调使用历史参与度评分作为排名考虑因素的一部分。
高质量的参与
参与度(例如用户在您的页面上停留很长时间的长时间点击)是有益的。
然而,低质量的参与,例如快速返回搜索结果(称为“pogo-sticking”),可能会对您的排名产生负面影响。
这些参与度指标可以影响您的排名位置和印象,从而提高您的主题权威。
但是,用户参与度不佳可能会导致页面排名下降。 从这种下降中恢复可能需要时间,这凸显了持续提供高质量、相关内容以鼓励用户积极参与的重要性。
SEO要点和应用
事实核查
谷歌可以检查事实的准确性。 投入时间创建真实准确的内容。
这包括适当的研究、事实核查和引用信誉良好的来源。 实施事实检查架构,为您的信息文章建立可信度和相关性
用户参与度
注意页面的用户参与度指标。 如果您的内容没有按预期吸引用户,请考虑修改您的内容策略。
抓取和索引
当我们结束对搜索过程的探索时,让我们看看 Google 的网络爬行和索引技术是如何随着其对实体的关注而发展的。
了解这些变化至关重要,因为它们直接影响您应该如何构建网站和制定内容策略,包括构建主题地图。
在“搜索引擎2.0”时代,谷歌的网络爬虫,也称为蜘蛛,系统地浏览互联网以发现新的和更新的页面。
他们会跟踪从一个网页到另一个网页的链接,并收集每个页面的数据以存储在谷歌的索引中。 此过程主要是为了发现新内容并确保索引保持最新。
一旦爬虫发现了一个页面,它就会被添加到谷歌的索引中——谷歌发现的所有网页的庞大数据库。
对每个页面的内容(包括文本、图像和视频)进行分析,并根据这些内容对页面进行分类。
主要关注的是文本中的关键字和短语以及反向链接等因素,这些因素用于确定页面的相关性和权威性。
快进到“搜索引擎3.0”时代,事情变得更加复杂。
谷歌的抓取工具仍然通过跟踪互联网上的链接来发现新的和更新的页面。 但现在,他们还试图理解页面上的关键字所代表的实体。
例如,有关“Elvis”的页面也可能会在“摇滚音乐”、“Graceland”和“Blue Suede Shoes”等相关实体下编入索引。
此外,他们还会跟踪您的内部链接以了解您的网站将哪些实体关联在一起。
这有点像图书馆员,不仅根据书名对书籍进行编目,而且还阅读它们以了解各章节之间的相互关系以及与本书的整体主题的关系。
这种更深入的了解有助于谷歌提供更相关和更精确的搜索结果。
但是爬行与主题权威和实体有何关系?
好吧,当谷歌抓取一个网站时,它不再只是孤立地查看各个页面。 它还着眼于网站的整体主题或主题。
这就是话题权威的用武之地。
如果一个网站持续发布特定主题的高质量内容,则可以被视为该主题的权威。
如果谷歌认为该网站具有权威性,它可以提高其在搜索结果中的排名。 (通常,您会看到具有较小反向链接配置文件的网站在竞争性术语中排名,这可能是由于它们获得了主题权威分数的提升。)
有趣的是,话题权威的概念已经存在至少几年了,但直到最近才被谷歌承认。
2023 年 5 月 23 日,谷歌发布了《理解新闻主题权威》。
尽管许多经验丰富的 SEO 认为主题权威是排名因素,但没有人可以通过 Google 发布的内容来验证这一点(除了挖掘正在申请的专利之外)。
不要被本新闻稿中的“新闻”一词误导。 主题权威涉及 Google 抓取的网络上的所有网站,而不仅仅是新闻网站。
Google 的专利 US20180046717A1 概述了主题权威的概念。
该专利描述了一种根据网站内特定主题的一致性和深度来确定网站权威的过程。
例如,一个持续发布有关“有机园艺”的高质量内容的网站可能具有高纯度因素(是的,谷歌会查看您的网站停留在主题上的能力),从而有助于获得更高的权威分数。
此外,Google 可以从您的内容中提取主要主题并绘制您的内容的图表,就像 ChatGPT 在嵌入(特征向量)中绘制单词图表一样。
这使得谷歌能够直观地看到您的内容是否相似和一致,进一步增强其对您网站的主题权威的理解。
因此,从本质上讲,谷歌索引系统的转变不仅仅是为了理解各个页面的内容,也是为了识别网站的主题焦点。
这强调了在内容策略中保持一致重点的重要性,因为它可以显着影响您的网站在搜索结果中的可见性。
SEO要点和应用
一致的主题焦点
谷歌可以识别您的网站何时偏离其主要主题。 如果您的内容不一致,可能会混淆您网站的目的和目标。
在内容策略中保持一致的重点,以便从与主题权威相关的得分提升中受益。
内容深度
建立内容的深度是关键,但它应该是相关的深度。 利用您对网站主要目的的理解来指导内容的深度。
例如,如果您网站的主要目的是提供有关数码摄影技术的信息,则不要转而深入撰写有关胶片相机的历史。
虽然它与摄影相关,但它与您网站对数字技术的主要关注点并不一致。 相反,通过探索各种数码摄影技术、回顾数码相机或提供编辑数码照片的技巧来加深您的内容。
太多的内容可能会削弱你的权威
网站上的太多内容会削弱网站的意义和目的。
梳理你的站点地图,确保它只包含支持你的关键想法的内容,并且内容的质量足以帮助Google理解实体。
使用上下文桥梁
创建新内容时,使用“上下文桥梁”将其连接回网站的主要目的非常重要。
不要简单地向您的网站添加新内容,而要始终问自己如何将新页面与您的主要目标联系起来。
这将允许 Google 开始将您的新页面实体与您的主要目标实体关联起来。
主题权威的限制和约束
虽然我们希望专注于在我们创建的任何网站上建立主题权威,但仍然存在一些限制。
这些限制是 Web 2.0 时期挥之不去的排名因素,Google 仍然授予合理数量的排名权力:网络时间和反向链接。
首先,话题权威需要时间的打造。 随着最近人工智能内容创作工具的爆炸式增长,这个时间线可以大大缩短,但这仍然需要时间。
主题权威的使用也与您所在领域的其他网站的“权威”程度有关。
例如,如果您根据令人难以置信的主题地图创建精彩的内容,您仍然会与您所在领域的其他网站进行比较。
如果这些其他网站随着时间的推移也已经发展了很大的话题权威,那么我们就会顺从反向链接和网络时间的古老问题。
想要超越已经发展出良好的实体发展并且在已经存在网络几年或更长时间的域上做到这一点的网站是极其困难的。 当然有可能,但仍然很困难。
我们来谈谈反向链接。
虽然很可能在不使用反向链接的情况下建立排名良好的网站,但即使是经验丰富的 SEO 也可能很难做到这一点。
反向链接仍然是一个非常重要的排名因素。 当然,他们可能不像以前那么强大,但他们仍然强大。
给反向链接提供如此大的排名能力的问题来自于实际上并不“专门”于任何主题的大型新闻集团网站。
我们都见过这样的情况:我们用 Google 搜索“xyz 的最佳小部件”,前 10-15 个结果是新闻网站,这些网站都声称拥有购买这些小部件的最佳指南。
新闻网站是否专门开发或销售这些小部件?
这些新闻网站在这些小部件方面是否具有话题权威?
一点也不。
如果新闻网站对这些小部件没有话题权威,为什么它们仍然主导 SERP? 这取决于网络上的时间和反向链接配置文件。
由于这些大型新闻网络的编辑知道,一旦单击发布按钮,他们的排名就会非常高,因此他们会在其网站上征求广告空间的销售。
公司还知道他们的产品将在 Google SERP 中名列前茅,因此他们愿意为此功能支付数千美元。
从本质上讲,他们在发布任何内容时都会利用新闻网站主导 SERP 的能力,因此被称为寄生虫 SEO。
无论您的网站在话题上有多权威,它都很难与这些新闻网站巨头竞争。
不幸的是,在谷歌解决这个问题之前,成为话题权威还不足以与新闻网站主导的一些热门 SERP 竞争。
掌握实体时代的SEO
希望通过指导您完成从查询处理到索引和排名的整个过程,我已经帮助您更新了“概念机器”,以更好地适应 Google 搜索引擎的最新变化。
这种精细的理解应该有助于改进您的策略,您可以将时间和排名集中在您自己的网站和客户的网站上。
最后,重要的是要记住,理论只有在实践中应用才能真正发挥作用。
例如,联盟 SEO 从业者很久以前就发现,在其主题上生成大量内容可能会引发主题权威 SEO 的提升。
早在我们对实体 SEO 理解的演变发挥作用之前,这一点就已经实现了。
SEO 的旅程总是在不断发展,充满发现和改进的机会。
因此,有了这些知识和见解,您就可以深入研究、试验并制定自己的 SEO 策略了。 毕竟,布丁的好坏在于吃的过程中。 测试愉快!
本文由Paul DeMott共同撰写。
这是实体SEO系列的第三篇文章。 如果您想从阅读前两篇文章开始,它们的链接如下:
- 实体 SEO 的权威指南
- 如何针对实体进行优化
- 使用 AI 进行全站实体优化的 3 种方法
本文表达的观点是客座作者的观点,并不一定是搜索引擎土地的观点。 此处列出了工作人员作者。