ChatGPT 如何幫助您優化實體內容
已發表: 2023-08-07如果策略性地使用,ChatGPT 的輸出質量可以超越人工。
不,這些工具不會寫出更好的內容。
相反,我相信擁有這項技術的作家可以製作出更符合谷歌排名標準的優化內容。
通過探索內容評分和實體提取的各種方法,我的目標是指導您最大限度地發揮這些工具的優勢。
“超越關鍵詞:實體如何影響現代 SEO 策略”討論瞭如何以及為何在網站中包含相關實體(即主題地圖)。
本文將重點介紹為什麼以及如何使用實體來創建排名更好的 SEO 內容。
實體 SEO 和 OpenAI 有什麼關係?
在討論軟件如何優化搜索結果的實體使用之前,我們先了解一下實體 SEO 和 OpenAI 的 ChatGPT 之間的相似之處。
語言的構建塊
在最基本的層面上,語言是圍繞以下內容構建的:
- 主題:句子是關於什麼(或誰)的。
- 謂語:講述有關主語的事情。
例如,在句子“The cat sat on the mat”中,“The cat”是主語,“sat on the mat”是謂語。
Google 的搜索引擎和 OpenAI 的 ChatGPT 都是為了理解語言的基本結構而設計的。
語義搜索引擎專注於以計算有效的方式理解內容。
ChatGPT 更進一步,使用更多的計算來生成內容。
語義搜索引擎
谷歌的搜索引擎識別實體,這些實體本質上是網頁上句子的主語。
然後,它使用這些實體周圍的上下文來理解謂詞——或者關於這些實體的內容。
這使 Google 能夠了解頁面的內容以及它與用戶的搜索查詢的相關性。
Google 的知識圖譜描述了所考慮的關係。
當谷歌分析一篇文章時,它會使用其知識圖來獲得更深入的見解。
它識別內容中的相關實體和謂詞,這使得它能夠辨別該文章與哪些關鍵字搜索最相關。
OpenAI 的 ChatGPT
另一方面,ChatGPT 使用其轉換器模型和嵌入來理解主語和謂語。
具體來說,模型的注意力機制使其能夠理解句子中不同單詞之間的關係,從而有效地理解謂詞。
同時,嵌入可以幫助模型理解單詞本身的關係和含義,其中包括理解主題。
儘管存在巨大差異,ChatGPT 和實體 SEO 有一個共同的功能:
識別與主題相關的實體和謂詞。 這種共性強調了實體對於我們理解語言的重要性。
儘管很複雜,SEO 專業人員應該將精力集中在實體、主題及其謂詞上。
那麼我們如何利用這種新的理解來優化我們的內容呢?
優化實體的新內容
Google 識別網頁上的實體及其謂詞。 它還將它們與潛在相關的頁面進行比較。
本質上,它就像一個媒人,試圖找到用戶的搜索查詢和網絡上可用內容之間的最佳匹配。
鑑於 Google 的算法針對高質量結果進行了優化,請通過檢查前 10 個 Google 結果來開始優化過程。
這將使您深入了解 Google 對給定搜索詞青睞的屬性。
在我們的機構,我們應用一個框架來識別潛在的增強功能,可以使我們的文章質量提高 10-20%,我將在下面分享。
優先考慮正確方面的框架可以說明您的內容與排名最高的材料之間的差異。
在創建內容時,我們遵循這個框架並完成這些優先事項。
如果我們滿足所有這些標準,我們就能立即取得成功。
深入研究清單的實體部分
可以這樣想:
想像一下,谷歌跟踪某些實體及其謂詞一起出現的頻率。
它可以找出哪些組合對於搜索特定主題的用戶來說最重要。
作為 SEO 專家,您的目標應該是將這些關鍵實體包含在您的內容中,您可以通過對 Google 向您展示的最喜歡的結果進行逆向工程來識別這些關鍵實體。
如果您的網頁包含 Google 期望針對給定用戶搜索的實體和謂詞,您的內容將獲得更高的分數。
我們將在以後的討論中討論新實體關係的例外情況。
這就是戰略性地利用 ChatGPT 和 NLP 技術的工具發揮作用的地方,以幫助分析前 10 個結果。
由於您必須消耗的數據規模,手動嘗試此操作可能既耗時又困難。
步驟一:提取實體
要進行此分析,您需要模仿 Google 的本機實體和謂詞提取過程,然後將您的發現轉化為可行的行動計劃/作家指南。
用技術術語來說,這個練習被稱為命名實體識別,各種 NLP 庫都有自己獨特的方法。
幸運的是,市場上有許多內容編寫工具可以自動執行這些步驟。
然而,在盲目遵循 SEO 工具的建議之前,了解它會做什麼和不會做什麼會很有幫助。
命名實體識別(NER)
將 NER 視為一個兩步過程:發現和分類。
發現
- 第一步就像“我是間諜”的遊戲。 該算法逐字讀取文本,尋找可能是實體的單詞或短語。 這就像有人讀一本書並突出顯示人名、地點或日期。
分類
- 一旦算法發現了潛在的實體,下一步就是弄清楚每個實體是什麼類型。 這就像將突出顯示的單詞分類到不同的存儲桶中:一個用於人員,一個用於位置,一個用於日期,等等。
讓我們考慮一個例子。 如果我們有這樣一句話:“Elon Musk 於 1971 年出生於比勒陀利亞。”
在發現步驟中,算法可能會將“Elon Musk”、“Pretoria”和“1971”識別為潛在實體。
在分類步驟中,它將“Elon Musk”分類為Person ,將“Pretoria”分類為Location ,將“1971”分類為Date 。
該算法結合使用規則和經過大量文本訓練的機器學習模型。
這些模型從示例中了解了不同類型的實體的外觀,因此它們可以在遇到新文本時做出有根據的猜測。
關係抽取(RE)
NER 識別出文本中的實體後,下一步就是理解這些實體之間的關係。
這是通過稱為關係提取 (RE) 的過程來完成的。 這些關係本質上充當連接實體的謂詞。
在 NLP 的背景下,這些連接通常表示為三元組,它們是三個項目的集合:
- 課程。
- 一個謂詞。
- 一個東西。
主語和賓語通常是通過 NER 識別的實體,謂語是它們之間的關係,通過 RE 識別。
使用三元組來破譯和理解關係的概念非常簡單。 我們可以用最少的計算、時間或內存來掌握所呈現的核心思想。
通過只關注實體及其謂詞,我們可以很好地理解所說的內容,這證明了語言的本質。
刪除所有多餘的單詞,剩下的就是關鍵組成部分——如果你願意的話,這是作者正在編織的關係的快照。
提取關係並將其表示為三元組是 NLP 中的關鍵步驟。
它使計算機能夠理解文本的敘述以及所識別實體周圍的上下文,從而能夠更細緻地理解和生成人類語言。
請記住,谷歌仍然是一台機器,它對語言的理解與人類的理解不同。
此外,谷歌不必編寫內容,但必須平衡計算需求。 相反,它可以提取最少量的信息,從而實現將內容鏈接到搜索查詢的目標。
第 2 步:建立作家指南
我們必須模仿谷歌提取實體及其關係的過程,以生成有用的分析和路線圖。
我們必須在前 10 個搜索結果中理解並運用這兩個關鍵思想。 幸運的是,有多種方法可以構建路線圖。
- 我們可以依賴實體提取
- 我們可以提取關鍵詞短語。
實體路線
可以測試的一種方法是類似於 InLinks 等工具的方法。
這些平台可能利用 Google Cloud 的 NER API 對前 10 個結果進行實體提取。
接下來,他們確定內容中提取的實體的最小和最大頻率。
根據您對這些實體的使用情況,他們會對您的內容進行評分。
為了確定材料中實體的成功使用,這些平台通常會設計自己的實體識別算法。
優點和缺點
這種方法是有效的,可以幫助您創建更權威的內容。 然而,它忽略了一個關鍵方面:關係提取。
雖然我們可以將實體的使用與排名靠前的文章進行匹配,但驗證我們的內容是否包含這些實體之間的所有相關謂詞或關係是具有挑戰性的。 (注意:Google Cloud 不會公開共享其關係提取 API。)
此策略的另一個潛在陷阱是,它會促進包含前 10 篇文章中找到的每個實體。
理想情況下,您希望涵蓋所有內容,但現實情況是某些實體比其他實體更重要。
更複雜的是,搜索結果通常包含混合意圖,這意味著某些實體僅與滿足特定搜索意圖的文章相關。
例如,產品列表頁面的實體構成將與博客文章顯著不同。
對於作者來說,將單個單詞實體轉換為與其內容相關的主題也可能具有挑戰性。 打開和關閉某些競爭對手可以幫助解決這些問題。
不要誤會我的意思,我是這些工具的粉絲,並將它們用作我的分析的一部分。
我在這里分享的每種方法都有其自身的優點和缺點,所有這些都可以在一定程度上增強您的內容。
然而,我的目標是展示使用技術和 ChatGPT 來優化實體的多種方式。
關鍵詞短語路線
我們在工具中採用的另一個策略是從前 10 名競爭對手中提取最關鍵的關鍵詞短語。
關鍵詞短語的美妙之處在於其透明度,使最終用戶更容易理解它們所代表的含義。
另外,它們通常捕獲關鍵主題的主語和謂語,而不僅僅是主語或實體。
然而,一個缺點是用戶常常很難將這些關鍵詞無縫地融入到他們的內容中。
相反,他們傾向於硬塞關鍵詞,忽略了關鍵詞短語所體現的本質。
不幸的是,從開發人員的角度來看,根據作者捕捉關鍵詞短語本質的能力來衡量和評分是很困難的。
因此,開發人員必鬚根據關鍵字短語的確切使用情況進行評分,這會阻礙真正的預期行為。
關鍵詞短語方法的另一個顯著優勢是,關鍵詞通常充當 ChatGPT 等 AI 工具的路標,確保生成文本模型捕獲關鍵實體及其謂詞(即三元組)。
最後,考慮給出冗長的名詞列表與關鍵字短語列表之間的區別。
作為一名作家,你可能會發現從一堆不連貫的名詞中編織出一個連貫的敘述是令人困惑的。
但是,當您看到關鍵詞短語時,就更容易辨別它們如何在段落中自然地相互關聯,從而有助於形成更加連貫和有意義的敘述。
提取關鍵詞短語有哪些不同的方法?
我們已經確定關鍵詞短語可以有效地指導您需要撰寫的主題。
不過,值得注意的是,市場上的不同工具有不同的方法來提取這些關鍵短語。
關鍵詞提取是 NLP 中的一項基本任務,涉及識別可以總結文本內容的重要單詞或短語。
有幾種流行的關鍵字提取算法,每種算法在捕獲頁面上的實體時都有自己的優點和缺點。
TF-IDF(詞頻-逆文檔頻率)
儘管 TF-IDF 一直是 SEO 中的熱門討論點,但它經常被誤解,並且其見解並不總是得到正確應用。
令人驚訝的是,盲目遵循其評分可能會降低內容質量。
TF-IDF 根據文檔中每個單詞的出現頻率及其在所有文檔中的稀有性對文檔中的每個單詞進行加權。
雖然這是一種簡單快捷的方法,但它沒有考慮單詞的上下文或語義。
能提供什麼價值
高分單詞代表在各個頁面上頻繁出現但在整個頂級頁面集合中不常見的術語。
一方面,這些術語可以被視為獨特、獨特內容的標記。
它們可能會揭示您的目標關鍵字主題中競爭對手未完全涵蓋的特定方面或子主題,從而使您能夠提供獨特的價值。
然而,高分術語也可能具有誤導性。
TF-IDF 可以顯示對特定排名文章特別重要的術語的高分,但並不代表對排名通常重要的術語或主題。
一個基本的例子就是公司的品牌名稱。 它可以在單個文檔或文章中重複使用,但不能在其他排名文章中重複使用。
將其包含在您的內容中毫無意義。
另一方面,如果您發現 TF-IDF 分數較低的術語在高排名頁面中一致出現,則這些術語可能表明您的頁面應包含的關鍵“基線”內容。
它們可能不是唯一的,但它們對於與給定關鍵字或主題的相關性可能是必要的。
注意: TF-IDF 代表許多策略,但可以在變體中應用額外的數學。 其中包括像 BM25 這樣的算法來引入飽和點或計算收益遞減。
此外,通過追溯顯示每個術語在前 10 個頁面中包含該單詞的百分比,TF-IDF 可以得到極大的改進,而且通常是這樣。 在這裡,算法可以幫助您識別值得注意的術語,然後通過顯示排名前 10 的術語共享術語的程度來幫助您更好地理解“基線”術語。
RAKE(快速自動關鍵詞提取)
RAKE 將所有短語視為潛在關鍵字,這對於捕獲多單詞實體非常有用。
但是,它不考慮單詞的順序,這可能會導致出現無意義的短語。
對前 10 個頁面分別應用 RAKE 算法將為每個頁面生成一個關鍵短語列表。
下一步是尋找重疊——出現在多個排名靠前的頁面上的關鍵短語。
這些常見短語可能表示搜索引擎期望看到的與您的目標關鍵字相關的特別重要的主題。
通過將這些短語集成到您自己的內容中(以有意義且自然的方式),您可能會提高頁面的相關性,從而提高目標關鍵字的排名。
然而,值得注意的是,並非所有共享短語都一定有益。 有些可能很常見,因為它們是通用的或與主題廣泛相關。
目標是找到那些具有與您的特定關鍵字相關的重要含義和上下文的共享短語。
所有關鍵字提取技術都可以通過允許您使用大腦來打開或關閉競爭對手或關鍵字來改進。
打開和關閉競爭對手和特定關鍵字的能力將有助於解決上述問題。
競爭對手
關鍵詞
這種方法本質上提供了一種結合 RAKE(識別單個文檔中的關鍵短語)和更像 TF-IDF 的策略(考慮文檔集合中術語的重要性)的優點的方法。
通過這樣做,您可以更全面地了解目標關鍵字的內容格局,指導您創建獨特且相關的內容。
YAKE(另一個關鍵詞提取器)
最後, YAKE 考慮單詞的頻率及其在文本中的位置。
這可以幫助識別出現在文檔開頭或結尾的重要實體。
然而,它可能會錯過中間出現的重要實體。
每種算法都會掃描文本並根據各種標準(例如頻率、位置、語義相似性)識別潛在的關鍵字。
然後他們為每個潛在的關鍵詞打分; 選擇得分最高的關鍵詞作為最終關鍵詞。
這些算法可以有效地捕獲實體,但也存在局限性。
例如,它們可能會錯過罕見的實體或不會在文本中作為關鍵字出現。 他們還可能與具有多個名稱或以不同方式引用的實體發生衝突。
總之,與直接 NER 相比,關鍵字提供了一些增強功能。
- 它們對於作家來說更容易理解。
- 它們捕獲謂詞和實體。
- 正如我們將在下一節中看到的,它們為人工智能編寫實體優化內容提供了更好的指導。
開放人工智能
ChatGPT 和 OpenAI 是 SEO 領域真正的遊戲規則改變者。
為了充分發揮其潛力,它需要一位消息靈通的 SEO 專家來引導它沿著正確的道路前進,並需要一個精心構建的實體圖來指導它撰寫相關主題。
考慮一個場景:
您可能已經意識到,您可以前往 ChatGPT 並要求它寫一篇關於幾乎任何主題的文章,它會很樂意遵守。
然而,問題是,生成的文章是否會針對關鍵字進行優化排名?
我們必須明確區分一般內容和搜索優化內容。
當人工智能依靠自己的設備來編寫內容時,它往往會生成一篇吸引普通讀者的文章。
然而,針對 SEO 優化的內容卻有不同的調子。
谷歌傾向於青睞可掃描的內容,包括定義和必要的背景知識,並從根本上為讀者提供大量的鉤子來找到搜索查詢的答案。
ChatGPT 由 Transformer 架構提供支持,傾向於根據訓練數據中觀察到的頻率和模式生成內容。 這些數據的一小部分由排名靠前的 Google 文章組成。
相比之下,隨著時間的推移,谷歌會根據其對用戶的有效性來調整其搜索結果——本質上是內容的適者生存。
這些經久不衰的文章中發現的實體對於作為基礎內容進行模擬至關重要,而這些內容往往與 ChatGPT 開箱即用生成的內容有很大不同。
關鍵要點是,從可讀性角度來看獲勝者的內容與在 Google 環境中獲勝的內容之間存在差異。 在網絡內容的世界中,實用性勝過一切。
正如尼爾森很久以前所表明的那樣,可掃描性是至高無上的。
用戶更喜歡掃描網頁內容而不是從上到下閱讀。 這種行為通常遵循 F 形模式。 編寫在搜索中表現良好的內容應該注重易於瀏覽,而不是純粹為了從上到下閱讀而編寫。
ChatGPT 開箱即用
讓我們觀察一下 ChatGPT 開箱即用後的表現如何,使用 Noble 和 Inlinks 進行評分。
即使有精心設計的提示,如果沒有 Google 第一頁上正在運行的內容的上下文,ChatGPT 也經常會錯過目標,產生不太可能競爭的內容。
我促使 ChatGPT 寫了一篇關於“旅行護士每小時賺多少錢”的文章。
與 SEO 分析結合使用時
然而,當與 SERP 分析和對排名至關重要的關鍵詞相結合時,ChatGPT 才能發揮其真正的威力。
通過要求 ChatGPT 包含這些術語,人工智能將被引導生成主題相關的內容。
以下是需要記住的幾個要點
雖然 ChatGPT 將包含與主題相關的許多關鍵實體,但使用分析 SERP 結果的工具可以顯著增強內容中實體的組合。
此外,根據主題的不同,這些差異可能會更加明顯,但如果您多次運行此實驗,您會發現這是一個一致的趨勢。
基於關鍵詞的方法同時滿足兩個要求:
- 確保將最關鍵的實體納入其中。
- 提供更嚴格的評分系統,因為它們包含謂詞和實體。
額外的見解
ChatGPT 可能難以自行達到必要的內容長度。
頁面的意圖與博客風格的帖子偏離得越遠,ChatGPT 和單獨使用 ChatGPT 的 SEO 工具之間的性能差距就越明顯。
儘管人工智能具有強大的能力,但記住人為因素仍然至關重要。 由於搜索結果混合,並非所有頁面都應進行分析。
此外,關鍵詞提取技術並非萬無一失,邊緣情況可能會產生不相關的專有名詞,但這些專有名詞仍可能通過評分系統。
因此,人為乾預和人工智能之間的最佳平衡包括手動禁用任何具有不同意圖的競爭網站,並梳理關鍵字列表以刪除任何明顯錯誤的關鍵字。
最後一步:更進一步
我們討論的方法是一個起點,允許您創建比任何競爭對手更廣泛的實體及其謂詞的內容。
通過遵循這種方法,您所編寫的內容反映了 Google 已經青睞的頁面的特徵。
但請記住,這只是一個起點。 這些競爭頁面可能已經存在了一段時間,並且可能已經積累了更多的反向鏈接和用戶指標。
如果您的目標是超越他們,您需要讓您的內容更加脫穎而出。
隨著網絡越來越飽和人工智能生成的內容,有理由推測谷歌可能會開始青睞它信任的網站來建立新的實體關係。 這可能會改變內容的評估方式,更加強調原創思想和創新。
作為一名作家,這意味著不僅僅要合併前 10 名結果所涵蓋的主題。 相反,問問自己:您可以提供當前前 10 名中缺少的哪些獨特視角?
這不僅僅是工具的問題。 這是關於我們,戰略家,思想家,創造者。
這是關於我們如何使用這些工具以及我們如何平衡軟件的計算能力與人類思維的創造性火花。
就像在國際象棋世界中一樣,機器精度和人類聰明才智的結合才能真正發揮作用。
因此,讓我們擁抱這個 SEO 的新時代,我們正在創造內容並打造能與受眾產生共鳴並在廣闊的數字環境中脫穎而出的體驗。
本文表達的觀點是客座作者的觀點,並不一定是搜索引擎土地的觀點。 此處列出了工作人員作者。