搜索中的 AI:Bing 的 Fabrice Canel 的见解
已发表: 2023-05-04我最近与 Fabrice Canel 取得了联系,他在 Microsoft 拥有 26 年的搜索经验,并且是领导 Bing 团队抓取、处理和索引的首席产品经理。
Canel 提供了对人工智能在搜索中的状态以及新 Bing 中聊天体验集成的见解。
你能与 Bing Chat 讨论你最近的公告吗?
Fabrice Canel (FC) :2023 年 2 月,我们向世界介绍了全新的 AI 驱动的 Bing 和 Microsoft Edge,您的网络副驾驶。 从那时起,使用 Bing 的用户比以前多了,我们最近达到了 1 亿每日用户和 1 亿聊天。
然后,我们在 Windows、Skype、Edge Mobile 和 Bing Mobile 中启用了新的人工智能 Bing,包括语音访问。
最近几周,我们添加了各种方式来与新的 AI 驱动的体验进行交互,这些体验将这些功能扩展到全球范围内跨设备的数百万其他人。
- Bing Image Creator提供了用你自己的话创建图像的能力,启用新的 AI 驱动的视觉故事,允许通过事实、基于图像的时间线、民意调查、行动和相关主题探索 Bing 客户感兴趣的主题,
- AI 生成的故事为 Bing 客户提供了多种方式来消费一口大小的信息——通过文本、图像、视频和音频,
- AI 生成的 Bing 知识卡帮助 Bing 客户通过事实、基于图像的时间线、民意调查、行动和相关主题探索 Bing 客户感兴趣的主题。
- 访问新 Bing 并与之交互的另一种方法是在 SwiftKey 键盘应用程序中启用它,这使 Bing AI 体验与支持第三方键盘的任何 iOS 或 Android 移动体验仅一步之遥。 你可以在这里看到完整的公告。 (作者注:Bing 在 2016 年收购了 SwiftKey。)
您能否讨论一下将聊天体验集成到搜索中的想法(哲学、期望)?
FC:让我们进入幕后。 我想分享更多关于新必应及其诞生的信息。
下一代模型。 新的 Bing 运行在专门为搜索定制的新的下一代大型语言模型上。 它吸取了过去模型的重要经验和进步,而且速度更快、更准确、功能更强大。 简而言之,它的综合能力、总结能力、聊天能力和创造能力都要强得多。
微软普罗米修斯模型。 我们已经开发出一种专有的方式来使用我们的下一代模型,以最好地利用它的力量。
我们将这种能力和技术的集合称为 Prometheus 模型。 这种结合为 Bing 客户提供了更相关、更及时和更有针对性的结果,同时提高了安全性。
当我们在大型语言模型 (LLM) 上取得突破时,就像其他 LLM 一样,它是通过给定时间点的数据进行训练的,所以我们认为我们可以通过结合使用户体验更丰富、更相关、更准确它具有 Bing 后端的强大功能。
更具体地说,我们开发了一项名为 Prometheus 的专有技术,这是一种首创的 AI 模型,它将新鲜而全面的 Bing 索引、排名和答案结果与最先进模型的创造性推理能力相结合。
Prometheus 利用 Bing 和语言模型的强大功能,通过名为 Bing Orchestrator 的组件迭代地生成一组内部查询。 它旨在为给定对话上下文中的用户查询提供准确而丰富的答案。 一切都在几毫秒内完成。 我们将此 Prometheus 生成的答案称为聊天答案。
选择相关的内部查询并利用相应的 Bing 搜索结果是 Prometheus 的一个重要组成部分,因为它为模型提供了相关的和新鲜的信息,使其能够回答最近的问题并减少不准确——这种方法称为接地。
换句话说,模型对 Bing 提供的数据进行推理; 因此,Bing 数据通过 Bing Orchestrator 对其进行了处理。
下图说明了 Prometheus 在较高层次上的工作方式。
最后一步是 Prometheus 将天气、股票、体育、新闻等相关的 Bing 搜索答案附加到聊天答案,以提供更丰富、更具吸引力的用户体验,进一步利用 Bing 的强大功能。
得益于 Bing 基础技术,Prometheus 还能够将引文集成到聊天答案中的句子中,以便用户可以轻松单击以访问这些来源并验证信息。
将流量发送到这些来源对于健康的网络生态系统很重要,并且仍然是我们的首要 Bing 目标之一。 这对我们很重要,因为如果我们不向创建内容的人发送流量,就不会有网络生态系统。 人们投资于内容是有原因的,如果他们得不到回报,他们就会停止这样做。
将人工智能应用于核心搜索算法。 我们还将 AI 模型应用于我们的核心 Bing 搜索排名引擎,实现了二十年来最大的相关性跃升。
这种 AI 模型甚至可以使基本的搜索查询更加准确和相关。 新模型提高了我们对 Internet 上文档的理解,并更好地理解了如何将这些文档与用户查询相匹配。
新的用户体验——合并搜索和聊天。 我们重新设想了 Bing 客户如何与搜索、浏览器和聊天进行交互,将它们整合到一个统一的体验中。 这将开启一种全新的网络交互方式。
虽然从用户体验的角度来看,Prometheus 是一项卓越的、开创性的基于 AI 的创新,但我们还不清楚我们应该如何将其功能集成到 Bing 中。 有两个主要观点:
- 我们团队中的一些人认为搜索是一种根深蒂固的习惯,我们需要保持像今天的网络搜索一样的用户体验,并在主用户体验上添加 Prometheus 支持的聊天答案。 就像任何其他答案一样,聊天答案将根据其与查询的相关性赢得一席之地。
- Bing 的其他人认为这是一个机会,可以将搜索范例从经典的网络和答案结果转变为一种新的交互式、基于聊天的搜索方式。
两种思想流派都部分正确,但都不完全正确。
提倡经典搜索的团队通常使用导航查询来捍卫他们的观点。
推动对话方法的团队将呈现类似研究的搜索会话,例如购物或旅行。 我在下图中绘制了他们的查询以说明这一观察结果。
然后很明显,一些查询在经典或搜索模式下表现更好,而其他查询在对话或聊天模式下表现更好。
此外,一些用户可能更喜欢其中一个,这取决于查询。 因此,理想的 Bing 搜索产品必须根据用户的意图和偏好在搜索和聊天模式之间平滑过渡。
我们的设计团队接受了挑战,并在多次迭代后开发了一种新的用户体验,将搜索和聊天统一在一个界面中。 用户可以通过单击页面上的 UX 元素或简单地滚动或上下滑动来轻松地来回切换。
该产品或 UX 创新可以说与 Prometheus 技术一样重要,可确保人们可以直观地使用该产品以充分发挥其潜力。
我觉得现在 UX 和 SEO 几乎总是有相同的目标。 你对此有何看法?
再评:我同意。 了解您希望用户在访问您的某个网页时执行的操作非常重要。
你应该设计你的网页来做到这一点。 目标用户体验对搜索引擎也很重要。 相关性只是等式的一部分。
如果他们来到您的网站并且真的对转换感兴趣,但他们不是因为您的网站有问题,那么这对搜索引擎来说也是一种糟糕的体验。
Google 有自己的 EEAT 标准,而 EEAT 的 Bing 等价物非常相似。 这不仅仅是关于内容本身。 用户希望完成操作,而我们希望提高页面排名以帮助他们完成操作。
获取搜索营销人员所依赖的每日时事通讯。
见条款。
考虑到错误的可能性,Bing 将如何建议人们使用 Bing Chat 的输出?
FC:很难相信自从我们向世界发布新的人工智能 Bing 和 Edge 才过去两个多月。 在那段时间里,我们学到了很多东西并进行了一些改进。
我们对良性反馈循环和迭代推动我们的模型和体验的强大 Bing 改进感到高兴。
例如,我们引入了在以下之间切换聊天语气的功能:
- Precise ,专注于更短、更注重搜索的答案。
- Creative ,它给出的响应更长且更具描述性。
- 中间设置Balance介于两者之间。
Bing 客户会注意到用户体验中的颜色在紫色、蓝色和绿色之间变化,具体取决于所选择的颜色。 我们的目标是让 Bing 客户决定最能满足他们需求的聊天行为类型。 我们将继续根据反馈调整此体验。
在 Bing,我们致力于提供最佳结果。 如果你问 Bing Chat 地球是不是平的,它会告诉你地球不是平的,即使网上有很多关于这个话题的误导性内容。
我们对 AI 进行了大量投资,因为我们对它可以为人们、行业和社会做些什么感到乐观。
我们致力于将技术和人结合起来,以负责任的方式实现 AI 的承诺。 反馈和数据将有助于提高答案的质量。 保持您的反馈。
人们应该使用 Bing Chat 来创建和发布内容而无需编辑吗?
FC:我们尽最大努力找到最好的内容。
我们到了吗? 不,我们还不完美。 没有人是。
我们会在某一天吗? 或许。 请记住,它是一种工具,这个问题比您想象的要难。
例如,有时信誉良好的网站会提供多个相互矛盾的答案。 很难找出哪一个是错误的。
我最近进行了这个练习,试图为我女儿回答一个关于复杂数学几何问题的问题,我从受人尊敬的专家那里找到了两个不同的答案。 一个是对的,但我花了 1 到 2 个小时才弄明白。 即使是专家也会犯错。
Bing Search 的使用情况与 Bing Chat 的使用情况相比如何?
FC:现在还早得令人难以置信,我们仅在两个月前发布,大多数 Bing 客户在他们的生活中第一次体验到这种与搜索引擎聊天的能力。 他们正在发现和学习。 他们发现将搜索、聊天、答案和创建功能整合到一种体验中的价值。
Bing 现在有超过 1 亿的每日活跃用户。 聊天等新场景推动参与,包括超过 1 亿次聊天。
在 Preview 的数百万用户中,三分之一是 Bing 的新用户,这为出版商和网站管理员创造了全新的机会。 这仍是早期数据,但迹象令人鼓舞。
对于 SEO,因为现在还早,我的建议是坚持使用与以前相同的 SEO 剧本。
但是,随着新必应的使用不断增加,改变人们的搜索方式,请跟踪我们的通信并监控数据以进行必要的调整。
在接下来的几周内,我们将开始报告 Bing 网站管理员工具网站和 Bing 网站管理员工具 API 上的 Bing Chat 点击和印象。
您能谈谈数据新鲜度的重要性吗?
FC:最近 LLM 的突破是巨大的,但这些模型是用给定时间点的数据训练的。 Bing 的特别之处在于,您可以从 LLM和Bing 搜索后端的强大功能中获益。
这意味着 Bing Chat 包含几秒钟前在线发布的内容。 您可以通过 Bing Chat 了解今天发生的事情 – 现在正在发生的事情。
如今,新鲜度非常重要,尤其是对于年轻一代而言。 我发现看到我的孩子们使用 Bing Chat 来详细了解最近发生的事件很有趣。 Bing 可以很好地处理这些类型的查询,即使在 Bing Chat 中也是如此,因为它建立在 Bing 索引之上。
人们花费大量时间的一个领域是新闻类事件,包括名人新闻。 人们将大量时间花在当下正在发生的事情上。
您能否概述一下什么是 IndexNow?
FC: IndexNow 是网站所有者即时通知所有搜索引擎其网站上最新内容更改的简便方法。
在最简单的形式中,IndexNow 是一个简单的 ping,以便搜索引擎知道 URL 及其内容已被添加、更新或删除,从而使搜索引擎能够在其搜索结果中快速反映这一变化。
我觉得有趣的是,你问这个问题并在 Bing Chat 的背景下谈论 IndexNow,它利用了一流的 AI 模型。
虽然 AI 非常有助于在线检索最佳内容并查看网站上的更改,但我们无法 100% 准确地知道您是否在网站上添加、修改或删除了内容。 但是您知道 100% 的精度,或者至少您的 CMS 知道这一点。
我们为网站管理员提供了要求搜索引擎爬虫访问以收集最新内容更改的功能,而不是反复爬取以发现您的内容是否已更改。
自从我们在 2021 年秋季启用 IndexNow 协议以来,IndexNow 的采用率持续增长。
如今,每天有超过 2000 万个网站向 IndexNow API 发布超过 25 亿个 URL。 本月,IndexNow 将网络搜索结果中点击的所有新 URL 归因于 10%。
很高兴看到更多搜索引擎、内容管理系统(即 Wix)和顶级网站采用 IndexNow。 我们的目标是在两年内超过 50% 的网络将采用 IndexNow。
为什么爬行如此复杂? 网络到底有多大?
互联网的真实规模是无限的。 我们每天都会发现超过 700 亿个不同的 URL。 垃圾邮件和重复内容太多了。
垃圾邮件发送者抢夺域并生成数百个子域。 没有搜索引擎再根据索引大小进行交流,因为它不是衡量质量的好方法。
最大的问题是你如何浏览所有低质量的内容来索引重要的内容。 为了使这更容易,我们需要网站管理员帮助引导搜索引擎找到真实的东西。 最好的方法是结合使用 IndexNow 和 XML 站点地图。 这对所有搜索引擎来说都是一个很好的设置。
Bing 预计有多少流量会转到新的 Bing Chat 模型中的网站?
FC:在接下来的几周内,我们将开始在 Bing 网站管理员工具中报告 Bing Chat 的点击次数和印象,以便每个网站所有者都可以将它们与 Bing 搜索页面进行比较。
搜索引擎在帮助人们找到他们想要的内容方面发挥了作用。 新必应通过聊天、答案和内容创建等新功能帮助更好地满足人们的搜索需求。
我们的目标是让我们的 Bing 用户满意,并在这个新的搜索世界中为发布商带来更多流量。 这是我们的首要目标,我们衡量成功的部分标准是我们从新的 Bing/Edge 发送了多少流量。
早期的进展令人鼓舞。 根据预览中的数据,我们正在吸引来自所有类型用户的更多流量。 我们已经让更多人使用 Bing/Edge 来使用聊天等新场景,并且使用量正在增加。
然后,我们采用了独特的方法来为发布者增加流量,包括在聊天答案正文中引用链接到来源和聊天结果下方的引用以“了解更多”并链接到其他来源。
我们启用扩展的悬停体验,将鼠标悬停在来自发布者的链接上将显示来自该发布者的更多链接,为用户提供更多参与方式并为发布者的网站带来更多流量。
我们也在倾听,并且在寻找机会为整个生态系统最大化这些新体验时,我们听到了积极的反馈。
如何创建可能被 Bing Chat 引用的内容?
FC:随着全新的人工智能 Bing 和 Microsoft Edge 的发布,我们增强了 Bing 网站管理员工具指南以支持这种体验。
我们列出了 Bing Chat 中的排名通常依赖于与主要网络搜索结果页面相同的参数。
因此,由于此时还为时过早,我建议坚持使用与以前相同的 SEO 手册,并且大多数推荐的手册都列在我们的 Bing 网站管理员工具指南中。
本文中表达的观点是客座作者的观点,不一定是 Search Engine Land。 此处列出了工作人员作者。