比较了 16 种最好的 AI 和 ChatGPT 内容检测器

已发表: 2023-04-25

随着每天都有新的 ChatGPT 替代品出现,AI 内容检测器也越来越受欢迎。

在本文中,我将分享其中的 16 个检测器,并向您展示它们如何对我未发表的原创文章的某些段落以及 ChatGPT 中同一主题的几个段落进行评分。

我还将介绍 AI 检测器适合(和不适合)的功能类型,以及营销人员、编辑和 SEO 应该如何考虑它们。

哪些检测工具擅长(和不擅长)

正如我在其他文章中详述的那样,生成式 AI 和 ChatGPT 内容会带来几个问题:

  • 人工智能生成的信息可能与事实不符、危险、过时或具有误导性。
  • AI 写作输出可能低于标准。
  • 虽然对人工智能内容没有明确的惩罚,但谷歌可能并不总是像人类创造的内容那样信任和看待它。
  • AI 内容可能能够“愚弄”那些认为他们为人工创建的内容付费的编辑或企业。
  • AI 内容可以利用人类的创造性作品,并在不注明出处的情况下重新利用它。

需要注意的是,目前的 AI 检测器并不能解决所有这些问题。

大多数情况下,这些工具不会对AI 内容进行事实核查,不会改进或审核内容质量,也不会为从其他来源获取的信息提供引用。

也就是说,人工智能检测器可以提供帮助的领域包括:

  • 剽窃:其中许多工具都内置了剽窃检测功能,因此可以检查 AI 内容是否主要来自其他来源。
  • 惩罚预防:如果您担心 AI 内容在搜索结果中以某种方式贬值,这些工具可以帮助您了解 AI 内容是多么容易被检测到。 (当然,谷歌无疑会有不同的工具和检查。)
  • 审计人工智能的使用:如果你有特定的政策或方式来补偿作者的原创内容与人工智能生成的内容,这些工具可以让你粗略地了解作者是否使用人工智能来生成内容。 (请注意,它们也可能返回假阴性和假阳性。)
  • 了解搜索结果:其中一些工具提供 Chrome 扩展程序,可以帮助您了解竞争对手和其他网站是否使用 AI 内容。

人工智能检测软件的工作原理

每个工具都是不同的,并且有其解决问题的方法。 但在大多数情况下,ChatGPT 检测工具会根据一段内容中短语选择的可预测性对内容进行分级。

换句话说,内容被评分为 AI 与人类的可能性与检测软件是否认为一篇文章遵循 AI 在生成内容时可能遵循的模式有很大关系。

围绕此过程的两个核心概念称为:

  • 突发性:句子结构的可预测长度和节奏。
  • 困惑:在一个句子或一组句子中选择的词的随机性。

例如,在一篇关于美国建国的文章中,生成式 AI 不太可能包含关于他们第一次看到企鹅的随机、不均匀的轶事,因此这很可能看起来像是人类写给检测工具的。

类似于 ChatGPT 检测器突然出现以检测生成式 AI 写作的方式,已经在开发工具来绕过检测器。 (而且,当然:检测器可能已经在考虑如何检测旁路者,等等)。

Undetectable 或 Quillbot 等工具会重写您的内容,有时会使某些 AI 检测工具更难检测到。

此外,一些人发现不同的提示可以让 ChatGPT 和其他 AI 写作工具通过使用定义突发性和困惑性的提示并告诉 ChatGPT 用更多的每个来写作,从而输出在人与 AI 规模上得分“更人性化”的内容。

检测精度对您重要吗?

在深入研究这些工具之前要回答的一个重要问题是:

您有多关心检测内容是否由 AI 编写? 为什么?

如果您使用 ChatGPT 重写标题标签或生成电子邮件副本,那么该内容是否“通过”AI 编写检查可能根本无关紧要。

此外,如果作者使用 AI 生成副本并且副本很棒,那么分数可能根本不重要。

这些检测工具很可能会与我上面提到的非检测工具和提示进行“检测军备竞赛”。


获取搜索营销人员所依赖的每日时事通讯。

处理中……请稍候。

见条款。


最好的 AI 书写检测器比较

如果您仍在寻找 AI/ChatGPT 内容检测器,我们将仔细研究它们中的每一个,以及它们如何在评估人工生成的副本与 AI 副本以及使用此提示尝试“击败检测”的 AI 副本时“得分” ”

注意:针对几段内容进行检测并不一定是对这些工具的检测能力的全面测试。 希望它能让您大致了解他们如何对不同的内容进行评分,并大致了解您可以从这些类型的工具中获得的结果范围。

(您可以查看输入到该工具的实际样本——我编写的“人类”样本、ChatGPT 通过 GPT-4 编写的“AI”样本,以及基于相同主题的更新副本。)

在下表中,您可以看到每种工具如何对我从头开始编写的副本、我直接从 ChatGPT 获取的副本(没有提示修改)以及使用“困惑和突发性”提示进行调整的副本进行评分:

Chatgpt Ai 写作检测器比较

下面简要概述了表中包含的工具及其一些主要功能。

1. 原创.AI

原创.AI

Originality.AI 是一款付费工具,被描述为“为严肃内容发布者打造的最准确的 AI 内容检测器和剽窃检查器”。

它每学分花费 0.01 美元,扫描 100 个单词。 它还具有 AI 扫描仪旁边的剽窃扫描仪。

从上图可以看出,这是唯一一个 100% 确信人类内容是人类并且 AI 内容是 AI(同时在所有情况下都是正确的)的 AI 扫描仪。

Hive Moderation(在本文后面讨论)基本上得出了相同的结论,人类内容的 AI 得分为 0%,两个 AI 生成的文本是 AI 的置信度为 99.9%。

除了拥有 Chrome 扩展程序和总分之外,Originality.AI 添加了一项功能,突出显示您粘贴的内容的特定部分,它预测会和不会是 AI。

我最常使用此工具来亲自检查 AI 内容。 我最常见的用例是检查与我们合作的自由作家提交的 AI 和剽窃内容。

2.作家

作家

Writer 提供了一个免费的检测器,最多可检测 1,500 个字符,并且需要 API 访问才能访问更多字符。

该工具基本上认为所有提交的内容都比较可能是人为生成的。

Writer 是一个 AI 写作平台,免费的内容检测器还可以让你输入一个 URL 来检查。

此工具中没有直接的抄袭功能,它会为您提供总分,但不会将特定部分标记为可能或不太可能由 AI 生成。

3. Copyleaks AI 内容检测器

Copyleaks AI 内容检测器

Copyleaks AI 内容检测器有一些有趣的功能:

  • 它给你一个整体的判断(人类或人工智能)。
  • 如果你将鼠标悬停在特定的文本上,它会给你一个百分比的可能性,即文本是人类复制的还是 AI 复制的。
  • 它预加载了跨不同 GPT 和人工输出的示例,以向您展示该工具的工作原理
  • 有一个 Chrome 扩展程序。

该工具是免费的,虽然一次扫描不能同时完成这两项工作,但它还有一个剽窃检测器。

它准确地将大部分人类生成的内容识别为人类,将大部分人工智能生成的内容识别为人工智能。 但是,它并不总是充满信心,并且在某些个别部分中是不正确的。

4. OpenAI 的 AI 文本分类器

OpenAI 的 AI 文本分类器

AI Text Classifier 是 OpenAI 的免费工具,该公司创建了 GPT(运行许多生成式 AI 工具)和 ChatGPT。

如果您认为制造最受欢迎的 AI 工具的公司会拥有最准确的检测器,那么这对我们的测试来说并不成立。

该工具将人类内容识别为“非常不可能”由 AI 生成,但将来自 OpenAI 自己平台的内容识别为“不清楚”是否由 AI 生成,以及“不太可能”由 AI 生成(有或没有额外提示)。

该工具是免费的(您需要一个 OpenAI 帐户)。 没有太多花里胡哨的东西,也没有抄袭检查。

你得到一个发现(就像你在屏幕截图中看到的那样)但没有精确的分数。 它也不会突出文案的特定部分,因为它们可能是 AI 生成的或不是。

5. Crossplag AI 内容检测器

Crossplag 人工智能内容检测器

Crossplag 提供一些无需帐户的免费扫描。 登录后,您将获得无限制的免费扫描。 该工具确实给出了总分,但不提供检查剽窃或标记内容的各个部分的能力。

Crossplaq 将人类和人工智能内容确定为 99% 的人类。 值得注意的是,该工具反复指出它在较长的文本上表现更好。

我们这里的样本超过了他们的 200 个字符的最低建议,但较短。

6.GPT零

GPT零

GPTZero 有免费和付费版本。 免费版本会给你一个分数,并有一些预装的例子。

付费版本还提供抄袭检查器,突出 AI 内容,并能够批量上传多条内容(实际上是为课堂环境设计的,就像许多这些工具一样)。

网站上未列出付费工具的定价,但您可以填写表格以请求访问付费工具和 API。

该工具的免费版本将我们的所有三个写作样本识别为可能完全是人类。

7. 树苗AI检测器

树苗 AI 检测器

Sapling AI Detector 提供免费和付费版本、Chrome 扩展、API、总分和句子突出显示。

Sapling 将人类内容识别为主要是人类,将 AI 内容识别为几乎完全是 AI。 然而,它发现“困惑”和“突发”的 ChatGPT 内容极有可能是人类。

8. Content at Scale 的 AI 检测器

Content at Scale 的 AI 检测器

Content at Scale AI Detector 是免费的,它提供了一个分数,其中包含内容中不同元素的细分(可预测性、概率和模式)和预填充示例。

不存在抄袭检测选项,并且不会突出显示各个内容部分。

Content at Scale 将所有三个样本评为 92% 或更高的人类。

人类确实拥有最高的人类百分比,其次是提示修改的 GPT 内容和最简单的提示生成的内容。

9.零GPT

零GPT

ZeroGPT 是一款免费工具,可提供总分和高亮显示,但不提供抄袭检测。

该工具全面返回了人工智能生成的可能性的低百分比。 它大致对应于样本的人性,人类生成的样本获得最低的 AI 百分比,其次是突发性/困惑提示,然后是更简单的提示)。

10. GLTR

GLTR

GLTR,即“巨型语言模型测试室”,是一款免费工具,由麻省理工学院-IBM 沃森人工智能实验室的 Hendrik Strobelt、Sebastian Gehrmann 和 Alexander Rush 与哈佛 NLP 合作开发。

该工具提供一些总体评分,但主要显示文本中的每个单词是否是人工智能根据文本中的先前上下文生成的 10、100、1,000 个或 1,000 个最有可能的单词之一。 这里没有设置剽窃功能。

对于由更简单的提示生成的文本,该工具返回了最多的“可能词”和前 10 个特别可能的词。

尽管如此,在这个小测试中,人类和额外的提示副本的分布是相似的。

11. 拥抱面的 ChatGPT 检测器

拥抱面的 ChatGPT 检测器

这是一个免费的检测器,可以给出整体预测和评分。 它没有任何抄袭或突出显示功能。

该工具为所有三个样本生成了超过 99.9% 的人类内容可能性。

12. 校正器 AI 内容检测器

校正器 AI 内容检测器

Corrector AI Detector 是一款免费工具,字数限制为 600 字,并提供百分比分数。 该工具没有剽窃或突出显示功能。

该工具将每个样本标记为“假”或 AI 的概率非常低。

13. Writefull GPT 检测器

Writefull GPT 检测器

Writefull GPT 检测器是一款免费工具,具有简单的评分和 API 访问权限。 没有突出显示,也没有抄袭检测。

它发现所有三个样本都可能是人类,但确实具有具有最高 AI 可能性 (19%) 的最简单提示的 ChatGPT 内容。

14. Hive Moderation 的 AI 生成内容检测

Hive Moderation 的 AI 生成内容检测

Hive Moderation AI-Generated Content Detection 工具是免费的(有字符限制,多次使用后需要登录)。

它不提供抄袭或突出显示,但允许您按部分分解内容并获得特定于部分的分数。

Hive 基本上对每个写作样本进行了正确评分,人类内容的 AI 可能性为 0%,AI 样本的得分为 99.9%。

(只有 Originality.AI 具有相似的置信度,同时在所有样本中都是准确的。)

15.释义工具AI内容检测器

释义工具 AI 内容检测器

解释工具是一个重写器,他们提供这个免费的 AI 内容检测器,具有总体结论和突出显示,并且没有抄袭功能。

释义工具得出的结论是,每个文本都可能是人类。

16. AI 写作检查

人工智能写作检查

AI Writing Check 是一款免费工具,可提供分数,具有最大字数,并且不具有针对 AI 概率或抄袭特征的文本高亮显示。

AI Writing Check 将所有三个写作样本都识别为人类。

测试 16 个 AI 和 ChatGPT 内容检查器的主要经验

再次强调一下我的主要发现是很重要的,因为三个简短的写作样本是非常小的样本,无法得出关于各个工具的坚定结论。

也就是说,我总体上发现了一些与 AI 书写检测器相关的有趣模式:

  • 校准:大多数工具发现所有三个书写样本极有可能或极不可能是人类。 在对人类和人工智能的内容进行评分时,不同的工具可能会“更硬”或“更软”,因此了解工具的校准方式有助于确定它们的用处。
  • 最罕见的功能:这些工具中的一些罕见功能包括批量上传、剽窃检测、具有 Chrome 扩展程序以及突出显示可能是人工智能与人类的特定部分。
  • 免费与付费:除了 Originality.AI 之外,这里介绍的所有工具都至少有免费版本。 但具有最准确结果和最“稀有功能”的工具往往是付费版本的工具。

如果您发现 AI 检测对您的项目有用,我建议您至少关注其中的一些工具。

AI 内容生成、编辑和检测的创新步伐可能很快会使您最喜欢的工具过时。


本文中表达的观点是客座作者的观点,不一定是 Search Engine Land。 此处列出了工作人员作者。