自然语言处理如何改变您的搜索方式
已发表: 2020-05-14谷歌努力通过每次算法更新来增强搜索引擎结果页面 (SERP) 中显示的列表的相关性。 SERP 的最新更新是 Google 的 Bidirectional Encoder Representations from Transformers (BERT),它利用自然语言处理。 BERT 被认为是谷歌在过去五年中引入的最重要的变化之一——直接影响了十分之一的搜索查询。
它旨在通过正确解释复杂的长尾搜索查询来显示更相关的结果。 在本文中,我们将讨论这意味着什么以及它如何改变您的搜索方式。
什么是伯特?
它是一种基于神经网络的 NLP 预训练技术,使 Google 能够更准确地识别给定搜索查询中单词的上下文。
例如,考虑短语“six to 10”和“a quarter to six”,相同的介词“to”在每个短语中具有不同的含义,这对搜索引擎来说可能并不明显。 然而,这就是 BERT 变得有用的地方,因为它可以有效地区分第一个短语中介词的上下文与第二个短语中介词的使用方式。 通过对上下文的理解,可以提供更相关的结果。
算法的神经网络有助于模式识别,而在数据集上训练的神经网络可以识别模式。 它的典型应用包括图像内容、预测金融市场趋势甚至识别手写内容。 而自然语言处理或 NLP 是处理语言学的人工智能 (AI) 的一部分。
- NLP 使计算机能够理解人类自然交流的方式。
- NLP 算法支持解释、理解和语言模式识别。
- NLP 模型突出显示语法和单词,以在无穷无尽的文本和语音中找到意义。
互联网用户和在线企业每天使用的 NLP 推动的进步包括社交聆听工具、单词建议和聊天机器人。
这是什么意思?
BERT 是一种 NLP 算法,它利用神经网络生成预训练模型。 这些模型使用网络上无穷无尽的数据进行训练。 预训练模型是经过进一步改进以执行特定 NLP 任务的通用 NLP 模型。 去年 11 月,谷歌开源了 BERT,声称它在 11 个 NLP 任务上提供了完整且相关的结果,包括斯坦福问答数据集。
BERT 的双向性使其有别于其他算法,因为这使它能够为单词提供上下文。 它不仅可以考虑导致该词的句子部分,还可以考虑它后面的部分来做到这一点。 双向性允许搜索引擎理解诸如“电影”之类的词的含义,该词在“橱窗电影”中使用时与与“大片”一起使用时具有不同的含义。
在搜索中,BERT 有助于理解查询的关键细节,尤其是在涉及复杂的会话查询或其中包含介词的查询时。 例如,在查询“2021 Indian traveler to Bali needs a visa”中,介词“to”表示该旅行者将从印度前往巴厘岛。 通过改变介词,你可以完全改变句子,读起来像“2021 Indian traveler from Bali needs a visa”,可能意味着旅行者来自巴厘岛,需要印度签证。 BERT 允许理解两个句子之间的上下文差异。
BERT 和 RankBrain 有什么区别?
RankBrain 是谷歌第一个应用于搜索的人工智能方法。 它与有机搜索排名算法并行运行,并对这些算法计算出的结果进行调整。 RankBrain 根据历史查询调整算法提供的结果。
RankBrain还有助于 Google 解释搜索查询,以便它可以显示可能与查询不完全相同的词的结果。 例如,当查找“迪拜地标的高度”时,它会自动显示与哈利法塔相关的信息。
另一方面,BERT 的双向组件使其以非常不同的方式运行。 传统算法通过查看页面中的内容来衡量相关性,而 NLP 算法更进一步,通过查看单词前后的内容来获取额外的上下文。 由于人类交流通常是复杂且多层次的,因此在处理自然语言方面取得的进步至关重要。
Google 使用 BERT 和 RankBrain 来处理和理解查询。 BERT 不能替代 RankBrain,但可以与其他 Google 算法一起应用或与 RankBrain 结合使用,具体取决于搜索词。
改进更多语言的搜索
由于能够将我们从一种语言中学到的知识应用到另一种语言中,BERT 被用来使搜索结果与世界各地的互联网用户更相关。 例如,我们从网络上使用最广泛的语言(例如英语)中学到的知识,然后可以应用于其他语言。 因此,以人们也在搜索的其他语言提供改进的结果。 此外,BERT 模型还增强了特色片段跨国家和语言的相关性。
BERT 如何影响您的业务?
BERT 还通过触发它提供受 BERT 更新影响的特色片段或网络结果来影响 Google Assistant。 像 BERT 这样的 NLP 技术增强了机器理解能力,这种创新无疑有利于许多在线用户和企业。 但是,关于 SEO,原则保持不变。 如果您的营销策略中根深蒂固了SEO 最佳实践,那么您就可以确信您的网站会取得成功。 始终如一地制作高质量、相关和新鲜内容的网站将从这次算法更新中获益最多。
基于关键字研究编写优质内容是一项练习,它将仍然是搜索引擎中的优先排名因素。 专注于让用户获得他们期望的信息丰富且准确的内容的网站所有者最终会在 SERP 上获得良好的排名。 在创建精彩内容的同时监控页面的性能将有助于网站保持相关性。
NLP 能解决搜索意图吗?
使用 BERT,无论查询中使用何种语言或单词,谷歌获得正确结果的机会都变得更高,但仍不是 100%。 例如,即使使用 BERT,任何搜索“内布拉斯加州以南的州”的人也可能得到“南内布拉斯加州”的结果,而不是堪萨斯州,这很可能是用户正在寻找的答案。
帮助机器理解语言仍然是一项持续的努力,从任何给定的查询中获得明确的含义是一个复杂的过程。 当 Google 将 NLP 应用于关键关键字列表时,显示的顶部结果可能不包含某些甚至仅包含一个必需的关键字,从而使这些结果不相关。 借助 BERT,谷歌通过为其算法提供复杂的更新来提升其游戏水平,但由于人类语言的复杂性,搜索仍然是一个未解决的问题。