ChatGPT 如何帮助您优化实体内容
已发表: 2023-08-07如果策略性地使用,ChatGPT 的输出质量可以超越人工。
不,这些工具不会写出更好的内容。
相反,我相信拥有这项技术的作家可以制作出更符合谷歌排名标准的优化内容。
通过探索内容评分和实体提取的各种方法,我的目标是指导您最大限度地发挥这些工具的优势。
“超越关键词:实体如何影响现代 SEO 策略”讨论了如何以及为何在网站中包含相关实体(即主题地图)。
本文将重点介绍为什么以及如何使用实体来创建排名更好的 SEO 内容。
实体 SEO 和 OpenAI 有什么关系?
在讨论软件如何优化搜索结果的实体使用之前,我们先了解一下实体 SEO 和 OpenAI 的 ChatGPT 之间的相似之处。
语言的构建块
在最基本的层面上,语言是围绕以下内容构建的:
- 主题:句子是关于什么(或谁)的。
- 谓语:讲述有关主语的事情。
例如,在句子“The cat sat on the mat”中,“The cat”是主语,“sat on the mat”是谓语。
Google 的搜索引擎和 OpenAI 的 ChatGPT 都是为了理解语言的基本结构而设计的。
语义搜索引擎专注于以计算有效的方式理解内容。
ChatGPT 更进一步,使用更多的计算来生成内容。
语义搜索引擎
谷歌的搜索引擎识别实体,这些实体本质上是网页上句子的主语。
然后,它使用这些实体周围的上下文来理解谓词——或者关于这些实体的内容。
这使 Google 能够了解页面的内容以及它与用户的搜索查询的相关性。
Google 的知识图谱描述了所考虑的关系。
当谷歌分析一篇文章时,它会使用其知识图来获得更深入的见解。
它识别内容中的相关实体和谓词,这使得它能够辨别该文章与哪些关键字搜索最相关。
OpenAI 的 ChatGPT
另一方面,ChatGPT 使用其转换器模型和嵌入来理解主语和谓语。
具体来说,模型的注意力机制使其能够理解句子中不同单词之间的关系,从而有效地理解谓词。
同时,嵌入可以帮助模型理解单词本身的关系和含义,其中包括理解主题。
尽管存在巨大差异,ChatGPT 和实体 SEO 有一个共同的功能:
识别与主题相关的实体和谓词。 这种共性强调了实体对于我们理解语言的重要性。
尽管很复杂,SEO 专业人员应该将精力集中在实体、主题及其谓词上。
那么我们如何利用这种新的理解来优化我们的内容呢?
优化实体的新内容
Google 识别网页上的实体及其谓词。 它还将它们与潜在相关的页面进行比较。
本质上,它就像一个媒人,试图找到用户的搜索查询和网络上可用内容之间的最佳匹配。
鉴于 Google 的算法针对高质量结果进行了优化,请通过检查前 10 个 Google 结果来开始优化过程。
这将使您深入了解 Google 对给定搜索词青睐的属性。
在我们的机构,我们应用一个框架来识别潜在的增强功能,可以使我们的文章质量提高 10-20%,我将在下面分享。
优先考虑正确方面的框架可以说明您的内容与排名最高的材料之间的差异。
在创建内容时,我们遵循这个框架并完成这些优先事项。
如果我们满足所有这些标准,我们就能立即取得成功。
深入研究清单的实体部分
可以这样想:
想象一下,谷歌跟踪某些实体及其谓词一起出现的频率。
它可以找出哪些组合对于搜索特定主题的用户来说最重要。
作为 SEO 专家,您的目标应该是将这些关键实体包含在您的内容中,您可以通过对 Google 向您展示的最喜欢的结果进行逆向工程来识别这些关键实体。
如果您的网页包含 Google 期望针对给定用户搜索的实体和谓词,您的内容将获得更高的分数。
我们将在以后的讨论中讨论新实体关系的例外情况。
这就是战略性地利用 ChatGPT 和 NLP 技术的工具发挥作用的地方,以帮助分析前 10 个结果。
由于您必须消耗的数据规模,手动尝试此操作可能既耗时又困难。
步骤一:提取实体
要进行此分析,您需要模仿 Google 的本机实体和谓词提取过程,然后将您的发现转化为可行的行动计划/作家指南。
用技术术语来说,这个练习被称为命名实体识别,各种 NLP 库都有自己独特的方法。
幸运的是,市场上有许多内容编写工具可以自动执行这些步骤。
然而,在盲目遵循 SEO 工具的建议之前,了解它会做什么和不会做什么会很有帮助。
命名实体识别(NER)
将 NER 视为一个两步过程:发现和分类。
发现
- 第一步就像“我是间谍”的游戏。 该算法逐字读取文本,寻找可能是实体的单词或短语。 这就像有人读一本书并突出显示人名、地点或日期。
分类
- 一旦算法发现了潜在的实体,下一步就是弄清楚每个实体是什么类型。 这就像将突出显示的单词分类到不同的存储桶中:一个用于人员,一个用于位置,一个用于日期,等等。
让我们考虑一个例子。 如果我们有这样一句话:“Elon Musk 于 1971 年出生于比勒陀利亚。”
在发现步骤中,算法可能会将“Elon Musk”、“Pretoria”和“1971”识别为潜在实体。
在分类步骤中,它将“Elon Musk”分类为Person ,将“Pretoria”分类为Location ,将“1971”分类为Date 。
该算法结合使用规则和经过大量文本训练的机器学习模型。
这些模型从示例中了解了不同类型的实体的外观,因此它们可以在遇到新文本时做出有根据的猜测。
关系抽取(RE)
NER 识别出文本中的实体后,下一步就是理解这些实体之间的关系。
这是通过称为关系提取 (RE) 的过程来完成的。 这些关系本质上充当连接实体的谓词。
在 NLP 的背景下,这些连接通常表示为三元组,它们是三个项目的集合:
- 课程。
- 一个谓词。
- 一个东西。
主语和宾语通常是通过 NER 识别的实体,谓语是它们之间的关系,通过 RE 识别。
使用三元组来破译和理解关系的概念非常简单。 我们可以用最少的计算、时间或内存来掌握所呈现的核心思想。
通过只关注实体及其谓词,我们可以很好地理解所说的内容,这证明了语言的本质。
删除所有多余的单词,剩下的就是关键组成部分——如果你愿意的话,这是作者正在编织的关系的快照。
提取关系并将其表示为三元组是 NLP 中的关键步骤。
它使计算机能够理解文本的叙述以及所识别实体周围的上下文,从而能够更细致地理解和生成人类语言。
请记住,谷歌仍然是一台机器,它对语言的理解与人类的理解不同。
此外,谷歌不必编写内容,但必须平衡计算需求。 相反,它可以提取最少量的信息,从而实现将内容链接到搜索查询的目标。
第 2 步:建立作家指南
我们必须模仿谷歌提取实体及其关系的过程,以生成有用的分析和路线图。
我们必须在前 10 个搜索结果中理解并运用这两个关键思想。 幸运的是,有多种方法可以构建路线图。
- 我们可以依赖实体提取
- 我们可以提取关键词短语。
实体路线
可以测试的一种方法是类似于 InLinks 等工具的方法。
这些平台可能利用 Google Cloud 的 NER API 对前 10 个结果进行实体提取。
接下来,他们确定内容中提取的实体的最小和最大频率。
根据您对这些实体的使用情况,他们会对您的内容进行评分。
为了确定材料中实体的成功使用,这些平台通常会设计自己的实体识别算法。
优点和缺点
这种方法是有效的,可以帮助您创建更权威的内容。 然而,它忽略了一个关键方面:关系提取。
虽然我们可以将实体的使用与排名靠前的文章进行匹配,但验证我们的内容是否包含这些实体之间的所有相关谓词或关系是具有挑战性的。 (注意:Google Cloud 不会公开共享其关系提取 API。)
此策略的另一个潜在陷阱是,它会促进包含前 10 篇文章中找到的每个实体。
理想情况下,您希望涵盖所有内容,但现实情况是某些实体比其他实体更重要。
更复杂的是,搜索结果通常包含混合意图,这意味着某些实体仅与满足特定搜索意图的文章相关。
例如,产品列表页面的实体构成将与博客文章显着不同。
对于作者来说,将单个单词实体转换为与其内容相关的主题也可能具有挑战性。 打开和关闭某些竞争对手可以帮助解决这些问题。
不要误会我的意思,我是这些工具的粉丝,并将它们用作我的分析的一部分。
我在这里分享的每种方法都有其自身的优点和缺点,所有这些都可以在一定程度上增强您的内容。
然而,我的目标是展示使用技术和 ChatGPT 来优化实体的多种方式。
关键词短语路线
我们在工具中采用的另一个策略是从前 10 名竞争对手中提取最关键的关键词短语。
关键词短语的美妙之处在于其透明度,使最终用户更容易理解它们所代表的含义。
另外,它们通常捕获关键主题的主语和谓语,而不仅仅是主语或实体。
然而,一个缺点是用户常常很难将这些关键词无缝地融入到他们的内容中。
相反,他们倾向于硬塞关键词,忽略了关键词短语所体现的本质。
不幸的是,从开发人员的角度来看,根据作者捕捉关键词短语本质的能力来衡量和评分是很困难的。
因此,开发人员必须根据关键字短语的确切使用情况进行评分,这会阻碍真正的预期行为。
关键词短语方法的另一个显着优势是,关键词通常充当 ChatGPT 等 AI 工具的路标,确保生成文本模型捕获关键实体及其谓词(即三元组)。
最后,考虑给出冗长的名词列表与关键字短语列表之间的区别。
作为一名作家,你可能会发现从一堆不连贯的名词中编织出一个连贯的叙述是令人困惑的。
但是,当您看到关键词短语时,就更容易辨别它们如何在段落中自然地相互关联,从而有助于形成更加连贯和有意义的叙述。
提取关键词短语有哪些不同的方法?
我们已经确定关键词短语可以有效地指导您需要撰写的主题。
不过,值得注意的是,市场上的不同工具有不同的方法来提取这些关键短语。
关键词提取是 NLP 中的一项基本任务,涉及识别可以总结文本内容的重要单词或短语。
有几种流行的关键字提取算法,每种算法在捕获页面上的实体时都有自己的优点和缺点。
TF-IDF(词频-逆文档频率)
尽管 TF-IDF 一直是 SEO 中的热门讨论点,但它经常被误解,并且其见解并不总是得到正确应用。
令人惊讶的是,盲目遵循其评分可能会降低内容质量。
TF-IDF 根据文档中每个单词的出现频率及其在所有文档中的稀有性对文档中的每个单词进行加权。
虽然这是一种简单快捷的方法,但它没有考虑单词的上下文或语义。
能提供什么价值
高分单词代表在各个页面上频繁出现但在整个顶级页面集合中不常见的术语。
一方面,这些术语可以被视为独特、独特内容的标记。
它们可能会揭示您的目标关键字主题中竞争对手未完全涵盖的特定方面或子主题,从而使您能够提供独特的价值。
然而,高分术语也可能具有误导性。
TF-IDF 可以显示对特定排名文章特别重要的术语的高分,但并不代表对排名通常重要的术语或主题。
一个基本的例子就是公司的品牌名称。 它可以在单个文档或文章中重复使用,但不能在其他排名文章中重复使用。
将其包含在您的内容中毫无意义。
另一方面,如果您发现 TF-IDF 分数较低的术语在高排名页面中一致出现,则这些术语可能表明您的页面应包含的关键“基线”内容。
它们可能不是唯一的,但它们对于与给定关键字或主题的相关性可能是必要的。
注意: TF-IDF 代表许多策略,但可以在变体中应用额外的数学。 其中包括像 BM25 这样的算法来引入饱和点或计算收益递减。
此外,通过追溯显示每个术语在前 10 个页面中包含该单词的百分比,TF-IDF 可以得到极大的改进,而且通常是这样。 在这里,算法可以帮助您识别值得注意的术语,然后通过显示排名前 10 的术语共享术语的程度来帮助您更好地理解“基线”术语。
RAKE(快速自动关键词提取)
RAKE 将所有短语视为潜在关键字,这对于捕获多单词实体非常有用。
但是,它不考虑单词的顺序,这可能会导致出现无意义的短语。
对前 10 个页面分别应用 RAKE 算法将为每个页面生成一个关键短语列表。
下一步是寻找重叠——出现在多个排名靠前的页面上的关键短语。
这些常见短语可能表示搜索引擎期望看到的与您的目标关键字相关的特别重要的主题。
通过将这些短语集成到您自己的内容中(以有意义且自然的方式),您可能会提高页面的相关性,从而提高目标关键字的排名。
然而,值得注意的是,并非所有共享短语都一定有益。 有些可能很常见,因为它们是通用的或与主题广泛相关。
目标是找到那些具有与您的特定关键字相关的重要含义和上下文的共享短语。
所有关键字提取技术都可以通过允许您使用大脑来打开或关闭竞争对手或关键字来改进。
打开和关闭竞争对手和特定关键字的能力将有助于解决上述问题。
竞争对手
关键词
这种方法本质上提供了一种结合 RAKE(识别单个文档中的关键短语)和更像 TF-IDF 的策略(考虑文档集合中术语的重要性)的优点的方法。
通过这样做,您可以更全面地了解目标关键字的内容格局,指导您创建独特且相关的内容。
YAKE(另一个关键词提取器)
最后, YAKE 考虑单词的频率及其在文本中的位置。
这可以帮助识别出现在文档开头或结尾的重要实体。
然而,它可能会错过中间出现的重要实体。
每种算法都会扫描文本并根据各种标准(例如频率、位置、语义相似性)识别潜在的关键字。
然后他们为每个潜在的关键词打分; 选择得分最高的关键词作为最终关键词。
这些算法可以有效地捕获实体,但也存在局限性。
例如,它们可能会错过罕见的实体或不会在文本中作为关键字出现。 他们还可能与具有多个名称或以不同方式引用的实体发生冲突。
总之,与直接 NER 相比,关键字提供了一些增强功能。
- 它们对于作家来说更容易理解。
- 它们捕获谓词和实体。
- 正如我们将在下一节中看到的,它们为人工智能编写实体优化内容提供了更好的指导。
开放人工智能
ChatGPT 和 OpenAI 是 SEO 领域真正的游戏规则改变者。
为了充分发挥其潜力,它需要一位消息灵通的 SEO 专家来引导它沿着正确的道路前进,并需要一个精心构建的实体图来指导它撰写相关主题。
考虑一个场景:
您可能已经意识到,您可以前往 ChatGPT 并要求它写一篇关于几乎任何主题的文章,它会很乐意遵守。
然而,问题是,生成的文章是否会针对关键字进行优化排名?
我们必须明确区分一般内容和搜索优化内容。
当人工智能依靠自己的设备来编写内容时,它往往会生成一篇吸引普通读者的文章。
然而,针对 SEO 优化的内容却有不同的调子。
谷歌倾向于青睐可扫描的内容,包括定义和必要的背景知识,并从根本上为读者提供大量的钩子来找到搜索查询的答案。
ChatGPT 由 Transformer 架构提供支持,倾向于根据训练数据中观察到的频率和模式生成内容。 这些数据的一小部分由排名靠前的 Google 文章组成。
相比之下,随着时间的推移,谷歌会根据其对用户的有效性来调整其搜索结果——本质上是内容的适者生存。
这些经久不衰的文章中发现的实体对于作为基础内容进行模拟至关重要,这些内容往往与 ChatGPT 开箱即用生成的内容有很大不同。
关键要点是,从可读性角度来看获胜者的内容与在 Google 环境中获胜的内容之间存在差异。 在网络内容的世界中,实用性胜过一切。
正如尼尔森很久以前所表明的那样,可扫描性是至高无上的。
用户更喜欢扫描网页内容而不是从上到下阅读。 这种行为通常遵循 F 形模式。 编写在搜索中表现良好的内容应该注重易于浏览,而不是纯粹为了从上到下阅读而编写。
ChatGPT 开箱即用
让我们观察一下 ChatGPT 开箱即用后的表现如何,使用 Noble 和 Inlinks 进行评分。
即使有精心设计的提示,如果没有 Google 第一页上正在运行的内容的上下文,ChatGPT 也经常会错过目标,产生不太可能竞争的内容。
我促使 ChatGPT 写了一篇关于“旅行护士每小时赚多少钱”的文章。
与 SEO 分析结合使用时
然而,当与 SERP 分析和对排名至关重要的关键词相结合时,ChatGPT 才能发挥其真正的威力。
通过要求 ChatGPT 包含这些术语,人工智能将被引导生成主题相关的内容。
以下是需要记住的几个要点
虽然 ChatGPT 将合并许多与主题相关的关键实体,但使用分析 SERP 结果的工具可以显着增强内容中实体的组合。
此外,根据主题的不同,这些差异可能会更加明显,但如果您多次运行此实验,您会发现这是一个一致的趋势。
基于关键词的方法同时满足两个要求:
- 确保将最关键的实体纳入其中。
- 提供更严格的评分系统,因为它们包含谓词和实体。
额外的见解
ChatGPT 可能难以自行达到必要的内容长度。
页面的意图与博客风格的帖子偏离得越远,ChatGPT 和单独使用 ChatGPT 的 SEO 工具之间的性能差距就越明显。
尽管人工智能具有强大的能力,但记住人为因素仍然至关重要。 由于搜索结果混合,并非所有页面都应进行分析。
此外,关键词提取技术并非万无一失,边缘情况可能会产生不相关的专有名词,但这些专有名词仍可能通过评分系统。
因此,人为干预和人工智能之间的最佳平衡包括手动禁用任何具有不同意图的竞争网站,并梳理关键字列表以删除任何明显错误的关键字。
最后一步:更进一步
我们讨论的方法是一个起点,允许您创建比任何竞争对手更广泛的实体及其谓词的内容。
通过遵循这种方法,您所编写的内容反映了 Google 已经青睐的页面的特征。
但请记住,这只是一个起点。 这些竞争页面可能已经存在了一段时间,并且可能已经积累了更多的反向链接和用户指标。
如果您的目标是超越他们,您需要让您的内容更加脱颖而出。
随着网络越来越饱和人工智能生成的内容,有理由推测谷歌可能会开始青睐它信任的网站来建立新的实体关系。 这可能会改变内容的评估方式,更加强调原创思想和创新。
作为一名作家,这意味着不仅仅要合并前 10 名结果所涵盖的主题。 相反,问问自己:您可以提供当前前 10 名中缺少的哪些独特视角?
这不仅仅是工具的问题。 这是关于我们,战略家,思想家,创造者。
这是关于我们如何使用这些工具以及我们如何平衡软件的计算能力与人类思维的创造性火花。
就像在国际象棋世界中一样,机器精度和人类聪明才智的结合才能真正发挥作用。
因此,让我们拥抱这个 SEO 的新时代,我们正在创造内容并打造能与受众产生共鸣并在广阔的数字环境中脱颖而出的体验。
本文表达的观点是客座作者的观点,并不一定是搜索引擎土地的观点。 此处列出了工作人员作者。