自然語言處理如何改變您的搜索方式

已發表: 2020-05-14

谷歌努力通過每次算法更新來增強搜索引擎結果頁面 (SERP) 中顯示的列表的相關性。 SERP 的最新更新是 Google 的 Bidirectional Encoder Representations from Transformers (BERT),它利用自然語言處理。 BERT 被認為是谷歌在過去五年中引入的最重要的變化之一——直接影響了十分之一的搜索查詢。

它旨在通過正確解釋複雜的長尾搜索查詢來顯示更相關的結果。 在本文中,我們將討論這意味著什麼以及它如何改變您的搜索方式。

什麼是伯特?

它是一種基於神經網絡的 NLP 預訓練技術,使 Google 能夠更準確地識別給定搜索查詢中單詞的上下文。

例如,考慮短語“six to 10”和“a quarter to six”,相同的介詞“to”在每個短語中具有不同的含義,這對搜索引擎來說可能並不明顯。 然而,這就是 BERT 變得有用的地方,因為它可以有效地區分第一個短語中介詞的上下文與第二個短語中介詞的使用方式。 通過對上下文的理解,可以提供更相關的結果。

算法的神經網絡有助於模式識別,而在數據集上訓練的神經網絡可以識別模式。 它的典型應用包括圖像內容、預測金融市場趨勢甚至識別手寫內容。 自然語言處理或 NLP 是處理語言學的人工智能 (AI) 的一部分。

  • NLP 使計算機能夠理解人類自然交流的方式。
  • NLP 算法支持解釋、理解和語言模式識別。
  • NLP 模型突出顯示語法和單詞,以在無窮無盡的文本和語音中找到意義。

互聯網用戶和在線企業每天使用的 NLP 推動的進步包括社交聆聽工具、單詞建議和聊天機器人。

這是什麼意思?

BERT 是一種 NLP 算法,它利用神經網絡生成預訓練模型。 這些模型使用網絡上無窮無盡的數據進行訓練。 預訓練模型是經過進一步改進以執行特定 NLP 任務的通用 NLP 模型。 去年 11 月,谷歌開源了 BERT,聲稱它在 11 個 NLP 任務上提供了完整且相關的結果,包括斯坦福問答數據集。

BERT 的雙向性使其有別於其他算法,因為這使它能夠為單詞提供上下文。 它不僅可以考慮導致該詞的句子部分,還可以考慮它後面的部分來做到這一點。 雙向性允許搜索引擎理解諸如“電影”之類的詞的含義,該詞在“櫥窗電影”中使用時與與“大片”一起使用時具有不同的含義。

在搜索中,BERT 有助於理解查詢的關鍵細節,尤其是在涉及復雜的會話查詢或其中包含介詞的查詢時。 例如,在查詢“2021 Indian traveler to Bali needs a visa”中,介詞“to”表示該旅行者將從印度前往巴厘島。 通過改變介詞,你可以完全改變句子,讀起來像“2021 Indian traveler from Bali needs a visa”,可能意味著旅行者來自巴厘島,需要印度簽證。 BERT 允許理解兩個句子之間的上下文差異。

BERT 和 RankBrain 有什麼區別?

RankBrain 是谷歌第一個應用於搜索的人工智能方法。 它與有機搜索排名算法並行運行,並對這些算法計算出的結果進行調整。 RankBrain 根據歷史查詢調整算法提供的結果。

RankBrain還有助於 Google 解釋搜索查詢,以便它可以顯示可能與查詢不完全相同的詞的結果。 例如,當查找“迪拜地標的高度”時,它會自動顯示與哈利法塔相關的信息。

另一方面,BERT 的雙向組件使其以非常不同的方式運行。 傳統算法通過查看頁面中的內容來衡量相關性,而 NLP 算法更進一步,通過查看單詞前後的內容來獲取額外的上下文。 由於人類交流通常是複雜且多層次的,因此在處理自然語言方面取得的進步至關重要。

Google 使用 BERT 和 RankBrain 來處理和理解查詢。 BERT 不能替代 RankBrain,但可以與其他 Google 算法一起應用或與 RankBrain 結合使用,具體取決於搜索詞。

改進更多語言的搜索

由於能夠將我們從一種語言中學到的知識應用到另一種語言中,BERT 被用來使搜索結果與世界各地的互聯網用戶更相關。 例如,我們從網絡上使用最廣泛的語言(例如英語)中學到的知識,然後可以應用於其他語言。 因此,以人們也在搜索的其他語言提供改進的結果。 此外,BERT 模型還增強了特色片段跨國家和語言的相關性。

BERT 如何影響您的業務?

BERT 還通過觸發它提供受 BERT 更新影響的特色片段或網絡結果來影響 Google Assistant。 像 BERT 這樣的 NLP 技術增強了機器理解能力,這種創新無疑有利於許多在線用戶和企業。 但是,關於 SEO,原則保持不變。 如果您的營銷策略中根深蒂固了SEO 最佳實踐,那麼您就可以確信您的網站會取得成功。 始終如一地製作高質量、相關和新鮮內容的網站將從這次算法更新中獲益最多。

基於關鍵字研究編寫優質內容是一項練習,它將仍然是搜索引擎中的優先排名因素。 專注於讓用戶獲得他們期望的信息豐富且準確的內容的網站所有者最終會在 SERP 上獲得良好的排名。 在創建精彩內容的同時監控頁面的性能將有助於網站保持相關性。

NLP 能解決搜索意圖嗎?

使用 BERT,無論查詢中使用何種語言或單詞,谷歌獲得正確結果的機會都變得更高,但仍不是 100%。 例如,即使使用 BERT,任何搜索“內布拉斯加州以南的州”的人也可能得到“南內布拉斯加州”的結果,而不是堪薩斯州,這很可能是用戶正在尋找的答案。

幫助機器理解語言仍然是一項持續的努力,從任何給定的查詢中獲得明確的含義是一個複雜的過程。 當 Google 將 NLP 應用於關鍵關鍵字列表時,顯示的頂部結果可能不包含某些甚至僅包含一個必需的關鍵字,從而使這些結果不相關。 借助 BERT,谷歌通過為其算法提供複雜的更新來提升其遊戲水平,但由於人類語言的複雜性,搜索仍然是一個未解決的問題。