Инструменты обнаружения контента ИИ существуют — но нужны ли они вам (и можно ли им доверять)?

Опубликовано: 2023-06-08

Многие отрасли борются с неосознанным использованием контента, созданного ИИ.

В высшем образовании, например, преподаватели хотят, чтобы студенты писали оригинальный контент, чтобы они могли оценивать навыки студентов без посторонней помощи. Таким образом, использование ими инструментов обнаружения контента с помощью ИИ имеет смысл.

Но как насчет маркетинга? Имеет ли значение, использует ли писатель генеративный ИИ, такой как ChatGPT, Google Bard, Microsoft Bing или другие? Что, если фрилансер сдаст статью, написанную с помощью генеративного инструмента искусственного интеллекта? Должны ли они платить так же, как если бы они написали это с нуля? Что, если они используют ИИ в качестве помощника и переделывают контент?

О недостатках копии, созданной ИИ, писали и подробно обсуждали. Среди основных моментов инструменты для письма с искусственным интеллектом:

  • Положитесь на существующую информацию — контент уже создан. Они не разрабатывают что-то творческое и новое, предоставляя читателю меньшую ценность.
  • Может генерировать ложную информацию . Вы не можете публиковать контент без тщательной проверки фактов.
  • Создавайте дублированный контент и проблемы с авторскими правами , если система ИИ получает слишком много похожих запросов. Идентичный контент вредит поисковой оптимизации (SEO), CRO электронной коммерции и репутации издателя.

Google вызвал некоторое замешательство, назвав материалы ИИ спамом . Но его сторонник поиска Джон Мюллер пояснил, что созданный машиной контент будет влечь за собой штраф, если он плохо написан, содержит ключевые слова и имеет низкое качество — такое же наказание применяется к контенту, созданному людьми с этими атрибутами.

Недавно писатель-фрилансер начал дискуссию в Твиттере, чтобы пролить свет на то, как эти инструменты искусственного интеллекта влияют на отношения с клиентами. Это показало, как клиенты отказывали в оплате, потому что они обвиняли фрилансеров в использовании инструментов для написания ИИ (хотя они этого не делали).

Но как компании пришли к выводу, что творения созданы с помощью ИИ? Скорее всего, они использовали инструменты обнаружения ИИ. Они могут показаться удобным средством проверки, но являются ли они лучшим подходом? Да, они могли предотвратить дезинформацию и плагиат. Но они также, как обнаружили эти фрилансеры, могут вызвать необоснованные обвинения в плагиате.

Примите во внимание обе точки зрения, если вы используете детекторы ИИ, и убедитесь, что вы понимаете ограничения.

Тестирование инструментов обнаружения AI-контента

Инструменты, предназначенные для различения контента, созданного человеком и созданным ИИ, могут выполнять лингвистический анализ, чтобы увидеть, есть ли в контенте проблемы с семантическим значением или повторениями (показатель участия ИИ). Они также могут проводить сравнительный анализ — система использует известный текст, сгенерированный ИИ, и оценивает контент, чтобы определить, похож ли он на него.

#Инструменты обнаружения AI-контента определяют, есть ли в тексте проблемы с семантическим значением или повторениями. Они также проверяют его на соответствие существующему контенту ИИ, — говорит Кейт Пэриш через @CMIContent. Нажмите, чтобы твитнуть

Для этой статьи я протестировал четыре популярных средства проверки ИИ, отправив два фрагмента контента — один созданный ИИ, а другой — созданный человеком. Вот что я нашел:

1. Классификатор ИИ

OpenAI, разработчики ChatGPT, также создали AI Classifier, чтобы различать текст, созданный AI, и текст, написанный человеком. Пользователи вставляют текст в открытое поле и нажимают «Отправить». Однако для завершения оценки требуется не менее 1000 символов, и она работает только для текста на английском языке.

Источник изображения

OpenAI говорит, что его тесты показывают, что вывод классификатора дает истинный положительный результат (вероятно, написанный ИИ) только в 26% случаев, что делает его ненадежным. В нем также говорится, что система неправильно идентифицирует контент, полученный от человека, как ИИ в 9% случаев.

@OpenAI говорит, что его #AIClassifier обнаруживает вероятный #контент, написанный AI, только в 26% случаев, говорит Кейт Пэриш через @CMIContent. Нажмите, чтобы твитнуть

Учитывая, что OpenAI собирает отзывы пользователей, система классификатора ИИ может улучшиться. Теперь давайте посмотрим, что произошло с моим тестом.

Текстовое заключение, созданное ИИ: точно. «Классификатор считает, что текст, возможно, сгенерирован искусственным интеллектом».

Текстовый вывод, созданный человеком: точный. «Классификатор считает, что текст вряд ли создан искусственным интеллектом».

Цена: Бесплатно

2. GPTZero

GPTZero называет себя детектором искусственного интеллекта № 1 в мире с более чем 1 миллионом пользователей. Он измеряет участие ИИ на основе сложности текста (недоумение) и вариативности предложений (взрывоопасность). Чем сложнее и разнообразнее, тем больше вероятность, что текст написал человек.

GPTZero по-прежнему имеет свои ограничения. Это лучше работает с более длинными постами, чем с короткими. Он также фокусируется на английском языке, написанном взрослыми, поэтому его выводы для других языков могут быть более неточными.

Пользователи вставляют свой текст в поле или загружают файл, а затем нажимают кнопку «Получить результаты».

Источник изображения

Текстовый вывод, созданный ИИ: неточно. Он выделяет текст, который считал созданным ИИ, но ошибочно полагал, что первые четыре абзаца были написаны человеком.

Текстовый вывод, созданный человеком: точный. Это не указывало на то, что какое-либо предложение с большей вероятностью было написано ИИ.

Цена: Бесплатно

3. Копилейки

Copyleaks обнаруживает искусственный интеллект и плагиат. Его можно использовать на своем сайте, в качестве расширения для браузера или интегрировать на ваш веб-сайт или в систему управления обучением.

Он поддерживает более 100 языков. Copyleaks возвращает вероятность в процентах относительно его уверенности в обнаружении контента, созданного ИИ.

Текст от ИИ (инструмент успешно выполнил задачу):

Источник изображения

Текстовое заключение, созданное ИИ: точно. Он выделил весь текст красным цветом, чтобы указать на обнаруженный контент ИИ (показана вероятность 96,5% для ИИ).

Текстовый вывод, созданный человеком: точный. Как говорится, «это человеческий текст» (вероятность 98,2% для человека).

Цена: Бесплатно

4. ГПТрадар

GPTRAdar имеет простой в использовании простой интерфейс. Его оценка включает в себя вывод и оценку сложности текста, чтобы указать, насколько хорошо он может предсказывать слова.

@GTPRadar делает вывод о том, является ли #content генерируемым человеком или искусственным интеллектом. Это также добавляет к оценке оценку недоумения, — говорит Кейт Пэриш через @CMIContent. Нажмите, чтобы твитнуть

Недоумение колеблется от единицы до бесконечности. Чем ниже показатель недоумения, тем больше вероятность того, что текст создан ИИ. Система также разделяет части текстов и помечает их как созданные человеком или искусственным интеллектом.

Источник изображения

Текстовый вывод, созданный ИИ: неправильно. Он пометил его как «вероятно созданный человеком» и присвоил ему 82 балла за недоумение.

Текстовый вывод, созданный человеком: точный. Он определил текст как «вероятно созданный человеком» и присвоил ему 102 балла за недоумение.

Цена: бесплатно 2000 токенов (около 2500 слов); два цента за 100 токенов

что впереди

По мере увеличения количества инструментов для работы с контентом, разработанных с помощью ИИ, последуют и другие решения для его обнаружения. Но остается одно предостережение: ни один инструмент не может быть точным на 100%.

Вы должны оценить, нужны ли инструменты обнаружения для вашего контент-маркетинга. Будете ли вы похожи на Google, который говорит, что качество, точность и актуальность контента важнее, чем роль ИИ в его создании? Или вы решите, что участие ИИ важнее для ваших целей?

Все инструменты, упомянутые в статье, идентифицированы автором. Если у вас есть инструмент, который вы можете предложить, не стесняйтесь добавлять его в комментариях.

Зарегистрируйтесь, чтобы принять участие в Content Marketing World в Вашингтоне, округ Колумбия. Используйте код BLOG100, чтобы сэкономить 100 долларов.

СООТВЕТСТВУЮЩИЙ КОНТЕНТ:

  • Как честный разговор с ChatGPT удивил даже редактора-ветерана
  • Как правильно использовать контент, созданный ИИ (и избежать недостатков)
  • Должны ли бренды следовать этическим принципам использования ИИ? Совет по связям с общественностью говорит «да»

Изображение на обложке: Джозеф Калиновски/Content Marketing Institute