搜索中的 AI:Bing 的 Fabrice Canel 的見解
已發表: 2023-05-04我最近與 Fabrice Canel 取得了聯繫,他在 Microsoft 擁有 26 年的搜索經驗,並且是領導 Bing 團隊抓取、處理和索引的首席產品經理。
Canel 提供了對人工智能在搜索中的狀態以及新 Bing 中聊天體驗集成的見解。
你能與 Bing Chat 討論你最近的公告嗎?
Fabrice Canel (FC) :2023 年 2 月,我們向世界介紹了全新的 AI 驅動的 Bing 和 Microsoft Edge,您的網絡副駕駛。 從那時起,使用 Bing 的用戶比以前多了,我們最近達到了 1 億每日用戶和 1 億聊天。
然後,我們在 Windows、Skype、Edge Mobile 和 Bing Mobile 中啟用了新的人工智能 Bing,包括語音訪問。
最近幾週,我們添加了各種方式來與新的 AI 驅動的體驗進行交互,這些體驗將這些功能擴展到全球範圍內跨設備的數百萬其他人。
- Bing Image Creator提供了用你自己的話創建圖像的能力,啟用新的 AI 驅動的視覺故事,允許通過事實、基於圖像的時間線、民意調查、行動和相關主題探索 Bing 客戶感興趣的主題,
- AI 生成的故事為 Bing 客戶提供了多種方式來消費一口大小的信息——通過文本、圖像、視頻和音頻,
- AI 生成的 Bing 知識卡幫助 Bing 客戶通過事實、基於圖像的時間線、民意調查、行動和相關主題探索 Bing 客戶感興趣的主題。
- 訪問新 Bing 並與之交互的另一種方法是在 SwiftKey 鍵盤應用程序中啟用它,這使 Bing AI 體驗與支持第三方鍵盤的任何 iOS 或 Android 移動體驗僅一步之遙。 你可以在這裡看到完整的公告。 (作者註:Bing 在 2016 年收購了 SwiftKey。)
您能否討論一下將聊天體驗集成到搜索中的想法(哲學、期望)?
FC:讓我們進入幕後。 我想分享更多關於新必應及其誕生的信息。
下一代模型。 新的 Bing 運行在專門為搜索定制的新的下一代大型語言模型上。 它吸取了過去模型的重要經驗和進步,而且速度更快、更準確、功能更強大。 簡而言之,它的綜合能力、總結能力、聊天能力和創造能力都要強得多。
微軟普羅米修斯模型。 我們已經開發出一種專有的方式來使用我們的下一代模型,以最好地利用它的力量。
我們將這種能力和技術的集合稱為 Prometheus 模型。 這種結合為 Bing 客戶提供了更相關、更及時和更有針對性的結果,同時提高了安全性。
當我們在大型語言模型 (LLM) 上取得突破時,就像其他 LLM 一樣,它是通過給定時間點的數據進行訓練的,所以我們認為我們可以通過結合使用戶體驗更豐富、更相關、更準確它具有 Bing 後端的強大功能。
更具體地說,我們開發了一項名為 Prometheus 的專有技術,這是一種首創的 AI 模型,它將新鮮而全面的 Bing 索引、排名和答案結果與最先進模型的創造性推理能力相結合。
Prometheus 利用 Bing 和語言模型的強大功能,通過名為 Bing Orchestrator 的組件迭代地生成一組內部查詢。 它旨在為給定對話上下文中的用戶查詢提供準確而豐富的答案。 一切都在幾毫秒內完成。 我們將此 Prometheus 生成的答案稱為聊天答案。
選擇相關的內部查詢並利用相應的 Bing 搜索結果是 Prometheus 的一個重要組成部分,因為它為模型提供了相關的和新鮮的信息,使其能夠回答最近的問題並減少不准確——這種方法稱為接地。
換句話說,模型對 Bing 提供的數據進行推理; 因此,Bing 數據通過 Bing Orchestrator 對其進行了處理。
下圖說明了 Prometheus 在較高層次上的工作方式。
最後一步是 Prometheus 將天氣、股票、體育、新聞等相關的 Bing 搜索答案附加到聊天答案,以提供更豐富、更具吸引力的用戶體驗,進一步利用 Bing 的強大功能。
得益於 Bing 基礎技術,Prometheus 還能夠將引文集成到聊天答案中的句子中,以便用戶可以輕鬆單擊以訪問這些來源並驗證信息。
將流量發送到這些來源對於健康的網絡生態系統很重要,並且仍然是我們的首要 Bing 目標之一。 這對我們很重要,因為如果我們不向創建內容的人發送流量,就不會有網絡生態系統。 人們投資於內容是有原因的,如果他們得不到回報,他們就會停止這樣做。
將人工智能應用於核心搜索算法。 我們還將 AI 模型應用於我們的核心 Bing 搜索排名引擎,實現了二十年來最大的相關性躍升。
這種 AI 模型甚至可以使基本的搜索查詢更加準確和相關。 新模型提高了我們對 Internet 上文檔的理解,並更好地理解瞭如何將這些文檔與用戶查詢相匹配。
新的用戶體驗——合併搜索和聊天。 我們重新設想了 Bing 客戶如何與搜索、瀏覽器和聊天進行交互,將它們整合到一個統一的體驗中。 這將開啟一種全新的網絡交互方式。
雖然從用戶體驗的角度來看,Prometheus 是一項卓越的、開創性的基於 AI 的創新,但我們還不清楚我們應該如何將其功能集成到 Bing 中。 有兩個主要觀點:
- 我們團隊中的一些人認為搜索是一種根深蒂固的習慣,我們需要保持像今天的網絡搜索一樣的用戶體驗,並在主用戶體驗上添加 Prometheus 支持的聊天答案。 就像任何其他答案一樣,聊天答案將根據其與查詢的相關性贏得一席之地。
- Bing 的其他人認為這是一個機會,可以將搜索範例從經典的網絡和答案結果轉變為一種新的交互式、基於聊天的搜索方式。
兩種思想流派都部分正確,但都不完全正確。
提倡經典搜索的團隊通常使用導航查詢來捍衛他們的觀點。
推動對話方法的團隊將呈現類似研究的搜索會話,例如購物或旅行。 我在下圖中繪製了他們的查詢以說明這一觀察結果。
然後很明顯,一些查詢在經典或搜索模式下表現更好,而其他查詢在對話或聊天模式下表現更好。
此外,一些用戶可能更喜歡其中一個,這取決於查詢。 因此,理想的 Bing 搜索產品必鬚根據用戶的意圖和偏好在搜索和聊天模式之間平滑過渡。
我們的設計團隊接受了挑戰,並在多次迭代後開發了一種新的用戶體驗,將搜索和聊天統一在一個界面中。 用戶可以通過單擊頁面上的 UX 元素或簡單地滾動或上下滑動來輕鬆地來回切換。
該產品或 UX 創新可以說與 Prometheus 技術一樣重要,可確保人們可以直觀地使用該產品以充分發揮其潛力。
我覺得現在 UX 和 SEO 幾乎總是有相同的目標。 你對此有何看法?
再評:我同意。 了解您希望用戶在訪問您的某個網頁時執行的操作非常重要。
你應該設計你的網頁來做到這一點。 目標用戶體驗對搜索引擎也很重要。 相關性只是等式的一部分。
如果他們來到您的網站並且真的對轉換感興趣,但他們不是因為您的網站有問題,那麼這對搜索引擎來說也是一種糟糕的體驗。
Google 有自己的 EEAT 標準,而 EEAT 的 Bing 等價物非常相似。 這不僅僅是關於內容本身。 用戶希望完成操作,而我們希望提高頁面排名以幫助他們完成操作。
獲取搜索營銷人員所依賴的每日時事通訊。
見條款。
考慮到錯誤的可能性,Bing 將如何建議人們使用 Bing Chat 的輸出?
FC:很難相信自從我們向世界發布新的人工智能 Bing 和 Edge 才過去兩個多月。 在那段時間裡,我們學到了很多東西並進行了一些改進。
我們對良性反饋循環和迭代推動我們的模型和體驗的強大 Bing 改進感到高興。
例如,我們引入了在以下之間切換聊天語氣的功能:
- Precise ,專注於更短、更注重搜索的答案。
- Creative ,它給出的響應更長且更具描述性。
- 中間設置Balance介於兩者之間。
Bing 客戶會注意到用戶體驗中的顏色在紫色、藍色和綠色之間變化,具體取決於所選擇的顏色。 我們的目標是讓 Bing 客戶決定最能滿足他們需求的聊天行為類型。 我們將繼續根據反饋調整此體驗。
在 Bing,我們致力於提供最佳結果。 如果你問 Bing Chat 地球是不是平的,它會告訴你地球不是平的,即使網上有很多關於這個話題的誤導性內容。
我們對 AI 進行了大量投資,因為我們對它可以為人們、行業和社會做些什麼感到樂觀。
我們致力於將技術和人結合起來,以負責任的方式實現 AI 的承諾。 反饋和數據將有助於提高答案的質量。 保持您的反饋。
人們應該使用 Bing Chat 來創建和發佈內容而無需編輯嗎?
FC:我們盡最大努力找到最好的內容。
我們到了嗎? 不,我們還不完美。 沒有人是。
我們會在某一天嗎? 或許。 請記住,它是一種工具,這個問題比您想像的要難。
例如,有時信譽良好的網站會提供多個相互矛盾的答案。 很難找出哪一個是錯的。
我最近進行了這個練習,試圖為我女兒回答一個關於復雜數學幾何問題的問題,我從受人尊敬的專家那裡找到了兩個不同的答案。 一個是對的,但我花了 1 到 2 個小時才弄明白。 即使是專家也會犯錯。
Bing Search 的使用情況與 Bing Chat 的使用情況相比如何?
FC:現在還早得令人難以置信,我們僅在兩個月前發布,大多數 Bing 客戶在他們的生活中第一次體驗到這種與搜索引擎聊天的能力。 他們正在發現和學習。 他們發現將搜索、聊天、答案和創建功能整合到一種體驗中的價值。
Bing 現在有超過 1 億的每日活躍用戶。 聊天等新場景推動參與,包括超過 1 億次聊天。
在 Preview 的數百萬用戶中,三分之一是 Bing 的新用戶,這為出版商和網站管理員創造了全新的機會。 這仍是早期數據,但跡象令人鼓舞。
對於 SEO,因為現在還早,我的建議是堅持使用與以前相同的 SEO 劇本。
但是,隨著新必應的使用不斷增加,改變人們的搜索方式,請跟踪我們的通信並監控數據以進行必要的調整。
在接下來的幾週內,我們將開始報告 Bing 網站管理員工具網站和 Bing 網站管理員工具 API 上的 Bing Chat 點擊和印象。
您能談談數據新鮮度的重要性嗎?
FC:最近 LLM 的突破是巨大的,但這些模型是用給定時間點的數據訓練的。 Bing 的特別之處在於,您可以從 LLM和Bing 搜索後端的強大功能中獲益。
這意味著 Bing Chat 包含幾秒鐘前在線發布的內容。 您可以通過 Bing Chat 了解今天發生的事情 – 現在正在發生的事情。
如今,新鮮度非常重要,尤其是對於年輕一代而言。 我發現看到我的孩子們使用 Bing Chat 來詳細了解最近發生的事件很有趣。 Bing 可以很好地處理這些類型的查詢,即使在 Bing Chat 中也是如此,因為它建立在 Bing 索引之上。
人們花費大量時間的一個領域是新聞類事件,包括名人新聞。 人們將大量時間花在當下正在發生的事情上。
您能否概述一下什麼是 IndexNow?
FC: IndexNow 是網站所有者即時通知所有搜索引擎其網站上最新內容更改的簡便方法。
在最簡單的形式中,IndexNow 是一個簡單的 ping,以便搜索引擎知道 URL 及其內容已被添加、更新或刪除,從而使搜索引擎能夠在其搜索結果中快速反映這一變化。
我覺得有趣的是,你問這個問題並在 Bing Chat 的背景下談論 IndexNow,它利用了一流的 AI 模型。
雖然 AI 非常有助於在線檢索最佳內容並查看網站上的更改,但我們無法 100% 準確地知道您是否在網站上添加、修改或刪除了內容。 但是您知道 100% 的精度,或者至少您的 CMS 知道這一點。
我們為網站管理員提供了要求搜索引擎爬蟲訪問以收集最新內容更改的功能,而不是反复爬取以發現您的內容是否已更改。
自從我們在 2021 年秋季啟用 IndexNow 協議以來,IndexNow 的採用率持續增長。
如今,每天有超過 2000 萬個網站向 IndexNow API 發布超過 25 億個 URL。 本月,IndexNow 將網絡搜索結果中點擊的所有新 URL 歸因於 10%。
很高興看到更多搜索引擎、內容管理系統(即 Wix)和頂級網站採用 IndexNow。 我們的目標是在兩年內超過 50% 的網絡將採用 IndexNow。
為什麼爬行如此復雜? 網絡到底有多大?
互聯網的真實規模是無限的。 我們每天都會發現超過 700 億個不同的 URL。 垃圾郵件和重複內容太多了。
垃圾郵件發送者搶奪域並生成數百個子域。 沒有搜索引擎再根據索引大小進行交流,因為它不是衡量質量的好方法。
最大的問題是你如何瀏覽所有低質量的內容來索引重要的內容。 為了使這更容易,我們需要網站管理員幫助引導搜索引擎找到真實的東西。 最好的方法是結合使用 IndexNow 和 XML 站點地圖。 這對所有搜索引擎來說都是一個很好的設置。
Bing 預計有多少流量會轉到新的 Bing Chat 模型中的網站?
FC:在接下來的幾週內,我們將開始在 Bing 網站管理員工具中報告 Bing Chat 的點擊次數和印象,以便每個網站所有者都可以將它們與 Bing 搜索頁面進行比較。
搜索引擎在幫助人們找到他們想要的內容方面發揮了作用。 新必應通過聊天、答案和內容創建等新功能幫助更好地滿足人們的搜索需求。
我們的目標是讓我們的 Bing 用戶滿意,並在這個新的搜索世界中為發布商帶來更多流量。 這是我們的首要目標,我們衡量成功的部分標準是我們從新的 Bing/Edge 發送了多少流量。
早期的進展令人鼓舞。 根據預覽中的數據,我們正在吸引來自所有類型用戶的更多流量。 我們已經讓更多人使用 Bing/Edge 來使用聊天等新場景,並且使用量正在增加。
然後,我們採用了獨特的方法來為發布者增加流量,包括在聊天答案正文中引用鏈接到來源和聊天結果下方的引用以“了解更多”並鏈接到其他來源。
我們啟用擴展的懸停體驗,將鼠標懸停在來自發布者的鏈接上將顯示來自該發布者的更多鏈接,為用戶提供更多參與方式並為發布者的網站帶來更多流量。
我們也在傾聽,並且在尋找機會為整個生態系統最大化這些新體驗時,我們聽到了積極的反饋。
如何創建可能被 Bing Chat 引用的內容?
FC:隨著全新的人工智能 Bing 和 Microsoft Edge 的發布,我們增強了 Bing 網站管理員工具指南以支持這種體驗。
我們列出了 Bing Chat 中的排名通常依賴於與主要網絡搜索結果頁面相同的參數。
因此,由於此時還為時過早,我建議堅持使用與以前相同的 SEO 手冊,並且大多數推薦的手冊都列在我們的 Bing 網站管理員工具指南中。
本文中表達的觀點是客座作者的觀點,不一定是 Search Engine Land。 此處列出了工作人員作者。