เครื่องมือค้นหาสามารถตรวจจับเนื้อหา AI ได้หรือไม่

เผยแพร่แล้ว: 2023-08-04

การระเบิดของเครื่องมือ AI ในปีที่ผ่านมาส่งผลกระทบอย่างมากต่อนักการตลาดดิจิทัล โดยเฉพาะผู้ที่ทำ SEO

เนื่องจากการสร้างเนื้อหาใช้เวลานานและมีค่าใช้จ่ายสูง นักการตลาดจึงหันมาใช้ AI เพื่อขอความช่วยเหลือ ซึ่งให้ผลลัพธ์ที่หลากหลาย

แม้จะมีประเด็นด้านจริยธรรม แต่คำถามหนึ่งที่เกิดขึ้นซ้ำๆ ก็คือ “เครื่องมือค้นหาสามารถตรวจจับเนื้อหา AI ของฉันได้หรือไม่”

คำถามนี้ถือว่ามีความสำคัญเป็นพิเศษเพราะหากคำตอบคือ "ไม่" คำถามอื่นๆ มากมายเกี่ยวกับว่าควรใช้ AI หรือไม่และอย่างไร

ประวัติศาสตร์อันยาวนานของเนื้อหาที่สร้างโดยเครื่อง

แม้ว่าความถี่ของการสร้างเนื้อหาที่สร้างโดยคอมพิวเตอร์หรือเนื้อหาที่มีความช่วยเหลือนั้นไม่เคยเกิดขึ้นมาก่อน แต่ก็ไม่ใช่เรื่องใหม่ทั้งหมดและไม่ใช่เชิงลบเสมอไป

ข่าวด่วนเป็นสิ่งจำเป็นสำหรับเว็บไซต์ข่าว และพวกเขาใช้ข้อมูลจากแหล่งต่างๆ มานาน เช่น ตลาดหุ้นและเครื่องวัดแผ่นดินไหว เพื่อเพิ่มความเร็วในการสร้างเนื้อหา

ตัวอย่างเช่น การเผยแพร่บทความโรบ็อตที่ระบุว่า:

“ตรวจพบแผ่นดินไหว [ขนาด] ใน [สถานที่ เมือง] เมื่อ [เวลา]/[วันที่] เมื่อเช้านี้ แผ่นดินไหวครั้งแรกนับตั้งแต่ [วันที่ของเหตุการณ์ล่าสุด] ติดตามข่าวสารเพิ่มเติม”

การอัปเดตเช่นนี้ยังเป็นประโยชน์สำหรับผู้อ่านที่ต้องการรับข้อมูลนี้โดยเร็วที่สุด

ในอีกด้านของสเปกตรัม เราได้เห็นการใช้งาน "หมวกดำ" มากมายสำหรับเนื้อหาที่สร้างโดยคอมพิวเตอร์

Google ได้ประณามการใช้ Markov chains เพื่อสร้างข้อความไปยังเนื้อหาที่ออกแรงน้อยปั่นมาเป็นเวลาหลายปี ภายใต้แบนเนอร์ของ "หน้าเว็บที่สร้างขึ้นโดยอัตโนมัติซึ่งไม่ได้ให้มูลค่าเพิ่ม"

สิ่งที่น่าสนใจเป็นพิเศษและส่วนใหญ่เป็นจุดที่สับสนหรือเป็นพื้นที่สีเทาสำหรับบางคนคือความหมายของ "ไม่มีมูลค่าเพิ่ม"

LLMs สามารถเพิ่มมูลค่าได้อย่างไร?

ความนิยมของเนื้อหา AI เพิ่มสูงขึ้นเนื่องจากได้รับความสนใจจาก GPTx โมเดลภาษาขนาดใหญ่ (LLMs) และแชทบอท AI ที่ปรับแต่งอย่างละเอียด ChatGPT ซึ่งปรับปรุงการโต้ตอบการสนทนา

โดยไม่ต้องเจาะลึกรายละเอียดทางเทคนิค มีประเด็นสำคัญสองสามข้อที่ต้องพิจารณาเกี่ยวกับเครื่องมือเหล่านี้:

ข้อความที่สร้างขึ้นจะขึ้นอยู่กับการแจกแจงความน่าจะเป็น

ตัวอย่างเช่น หากคุณเขียนว่า “การเป็น SEO นั้นสนุกเพราะ…” LLM จะดูโทเค็นทั้งหมดและพยายามคำนวณคำถัดไปที่เป็นไปได้มากที่สุดตามชุดการฝึกอบรม คุณสามารถคิดได้ว่ามันเป็นเวอร์ชันขั้นสูงของข้อความคาดการณ์ล่วงหน้าในโทรศัพท์ของคุณ

ChatGPT เป็นปัญญาประดิษฐ์ประเภทหนึ่ง

ซึ่งหมายความว่าผลลัพธ์ไม่สามารถคาดเดาได้ มีองค์ประกอบแบบสุ่ม และอาจตอบสนองต่อพรอมต์เดียวกันแตกต่างกัน

เมื่อคุณเข้าใจประเด็นทั้งสองนี้ จะเห็นได้ชัดว่าเครื่องมืออย่าง ChatGPT ไม่มีความรู้ดั้งเดิมหรือ "รู้" อะไรเลย ข้อบกพร่องนี้เป็นพื้นฐานสำหรับข้อผิดพลาดทั้งหมดหรือที่เรียกว่า "ภาพหลอน"

ผลลัพธ์ที่เป็นเอกสารจำนวนมากแสดงให้เห็นว่าวิธีการนี้สามารถสร้างผลลัพธ์ที่ไม่ถูกต้องและทำให้ ChatGPT ขัดแย้งในตัวเองซ้ำๆ ได้อย่างไร

ตัวอย่างจาก /r/ChatGPT — *ตัวอย่างจาก* */r/ChatGPT*

สิ่งนี้ทำให้เกิดข้อสงสัยอย่างมากเกี่ยวกับความสอดคล้องของ "การเพิ่มมูลค่า" กับข้อความที่เขียนโดย AI เนื่องจากมีความเป็นไปได้ที่จะเกิดภาพหลอนบ่อยครั้ง

ต้นเหตุอยู่ที่วิธีการสร้าง LLMs ซึ่งไม่สามารถแก้ไขได้โดยง่ายหากไม่มีวิธีการใหม่

นี่เป็นข้อพิจารณาที่สำคัญ โดยเฉพาะอย่างยิ่งสำหรับหัวข้อ Your Money, Your Life (YMYL) ซึ่งอาจส่งผลเสียอย่างมากต่อการเงินหรือชีวิตของผู้คนหากไม่ถูกต้อง

สิ่งพิมพ์สำคัญเช่น Men's Health และ CNET ถูกจับได้ว่าเผยแพร่ข้อมูลที่สร้างขึ้นโดย AI ที่ไม่ถูกต้องในปีนี้ โดยเน้นย้ำถึงความกังวล

ผู้เผยแพร่โฆษณาไม่ใช่คนเดียวที่ประสบปัญหานี้ เนื่องจาก Google มีปัญหาในการควบคุมเนื้อหาประสบการณ์การค้นหา (SGE) ด้วยเนื้อหา YMYL

แม้ว่า Google จะระบุว่าจะใช้ความระมัดระวังกับคำตอบที่สร้างขึ้นและยกตัวอย่างเฉพาะเจาะจงว่า "จะไม่แสดงคำตอบสำหรับคำถามเกี่ยวกับการให้ยาไทลินอลแก่เด็กเพราะมันอยู่ในพื้นที่ทางการแพทย์" SGE จะทำอย่างพิสูจน์ได้ เพียงแค่ถามคำถามนี้

รับจดหมายข่าวรายวันที่นักการตลาดไว้วางใจ

ดูข้อกำหนด

SGE และ MUM ของ Google

เป็นที่แน่ชัดว่า Google เชื่อว่ามีที่สำหรับเนื้อหาที่สร้างโดยคอมพิวเตอร์เพื่อตอบคำถามของผู้ใช้ Google บอกใบ้เรื่องนี้ตั้งแต่เดือนพฤษภาคม 2021 เมื่อพวกเขาประกาศ MUM ซึ่งเป็น Multitask Unified Model

ความท้าทายหนึ่งที่ MUM กำหนดขึ้นเพื่อแก้ไขนั้นขึ้นอยู่กับข้อมูลที่ผู้คนออกคำสั่งแปดข้อโดยเฉลี่ยสำหรับงานที่ซับซ้อน

ในข้อความค้นหาเริ่มต้น ผู้ค้นหาจะได้เรียนรู้ข้อมูลเพิ่มเติม แจ้งการค้นหาที่เกี่ยวข้องและแสดงหน้าเว็บใหม่เพื่อตอบคำถามเหล่านั้น

Google เสนอ: จะเกิดอะไรขึ้นหากพวกเขาใช้คำถามเริ่มต้น คาดการณ์คำถามติดตามผลของผู้ใช้ และสร้างคำตอบที่สมบูรณ์โดยใช้ความรู้ด้านดัชนี

หากวิธีนี้ได้ผล แม้ว่าวิธีการนี้อาจยอดเยี่ยมสำหรับผู้ใช้ แต่โดยพื้นฐานแล้วจะเป็นการลบล้างกลยุทธ์คำหลักแบบ “หางยาว” หรือไม่มีปริมาณจำนวนมากที่ SEO พึ่งพาเพื่อตั้งหลักภายใน SERPs

สมมติว่า Google สามารถระบุข้อความค้นหาที่เหมาะสมกับคำตอบที่สร้างโดย AI ได้ คำถามหลายข้ออาจถือว่า "แก้ไขแล้ว"

สิ่งนี้ทำให้เกิดคำถาม…

เหตุใด Google จึงแสดงหน้าเว็บของคุณแก่ผู้ค้นหาพร้อมคำตอบที่สร้างไว้ล่วงหน้า ในเมื่อพวกเขาสามารถรักษาผู้ใช้ไว้ในระบบนิเวศการค้นหาและสร้างคำตอบได้เอง

Google มีแรงจูงใจทางการเงินเพื่อให้ผู้ใช้อยู่ในระบบนิเวศ เราได้เห็นวิธีการต่างๆ เพื่อบรรลุเป้าหมายนี้ ตั้งแต่ตัวอย่างข้อมูลแนะนำไปจนถึงการอนุญาตให้ผู้คนค้นหาเที่ยวบินใน SERPs

สมมติว่า Google พิจารณาว่าข้อความที่คุณสร้างขึ้นไม่ได้ให้คุณค่าเกินกว่าที่จะสามารถให้ได้ ในกรณีนั้น มันจะกลายเป็นเรื่องของต้นทุนเทียบกับผลประโยชน์สำหรับเครื่องมือค้นหา

พวกเขาสามารถสร้างรายได้เพิ่มขึ้นในระยะยาวโดยการดูดซับค่าใช้จ่ายในการสร้างและทำให้ผู้ใช้รอคำตอบแทนที่จะส่งผู้ใช้อย่างรวดเร็วและราคาถูกไปยังหน้าเว็บที่พวกเขารู้ว่ามีอยู่แล้วหรือไม่

การตรวจจับเนื้อหา AI

นอกเหนือจากการใช้งาน ChatGPT แล้ว ยังมี “ตัวตรวจจับเนื้อหา AI” จำนวนมากที่ให้คุณป้อนเนื้อหาข้อความและแสดงคะแนนเป็นเปอร์เซ็นต์ ซึ่งเป็นปัญหาที่เกิดขึ้น

แม้ว่าตัวตรวจจับต่างๆ จะติดป้ายกำกับคะแนนเปอร์เซ็นต์นี้แตกต่างกันอยู่บ้าง แต่อุปกรณ์เหล่านี้มักจะให้ผลลัพธ์ที่เหมือนกันเสมอ นั่นคือเปอร์เซ็นต์ที่แน่นอนที่ข้อความที่ให้มาทั้งหมดนั้นสร้างโดย AI

สิ่งนี้ทำให้เกิดความสับสนเมื่อมีการระบุเปอร์เซ็นต์ เช่น “75% AI / 25% มนุษย์”

หลายคนจะเข้าใจผิดว่าข้อความนี้หมายถึง “ข้อความนี้เขียนโดย AI 75% และมนุษย์ 25%” เมื่อหมายความว่า “ฉันมั่นใจ 75% ว่า AI เขียนข้อความนี้ 100%”

ความเข้าใจผิดนี้ทำให้บางคนเสนอคำแนะนำเกี่ยวกับวิธีปรับแต่งการป้อนข้อความเพื่อให้ "ผ่าน" ตัวตรวจจับ AI

ตัวอย่างเช่น การใช้เครื่องหมายอัศเจรีย์คู่ (!!) เป็นลักษณะเฉพาะของมนุษย์ ดังนั้นการเพิ่มเครื่องหมายนี้ลงในข้อความที่สร้างโดย AI จะส่งผลให้ตัวตรวจจับ AI ให้คะแนน "99%+ ของมนุษย์"

สิ่งนี้จะตีความผิดว่าคุณได้ "หลงกล" เครื่องตรวจจับ

แต่นี่เป็นตัวอย่างของเครื่องตรวจจับที่ทำงานได้อย่างสมบูรณ์ เนื่องจากทางเดินที่ให้มานั้นไม่ได้สร้างโดย AI 100% อีกต่อไป

น่าเสียดายที่ข้อสรุปที่ทำให้เข้าใจผิดเกี่ยวกับความสามารถในการ "หลอก" ตัวตรวจจับ AI มักเกี่ยวข้องกับเครื่องมือค้นหา เช่น Google ตรวจไม่พบเนื้อหา AI ทำให้เจ้าของเว็บไซต์มีความรู้สึกผิดๆ เกี่ยวกับความปลอดภัย

นโยบายและการดำเนินการของ Google เกี่ยวกับเนื้อหา AI

คำชี้แจงของ Google เกี่ยวกับเนื้อหา AI นั้นคลุมเครือมากพอที่จะทำให้พวกเขามีช่องว่างเกี่ยวกับการบังคับใช้

อย่างไรก็ตาม คำแนะนำฉบับปรับปรุงได้รับการเผยแพร่ในปีนี้ใน Google Search Central ซึ่งระบุอย่างชัดเจนว่า:

“เรามุ่งเน้นที่คุณภาพของเนื้อหามากกว่าวิธีการผลิตเนื้อหา”

ก่อนหน้านี้ Google Search Liaison Danny Sullivan ได้เข้าร่วมในการอนุรักษ์ Twitter เพื่อยืนยันว่าพวกเขา "ไม่ได้กล่าวว่าเนื้อหา AI นั้นไม่ดี"

Google แสดงตัวอย่างที่เฉพาะเจาะจงว่า AI สามารถสร้างเนื้อหาที่เป็นประโยชน์ได้อย่างไร เช่น คะแนนกีฬา การพยากรณ์อากาศ และการถอดเสียง

เป็นที่ชัดเจนว่า Google ให้ความสำคัญกับผลลัพธ์มากกว่าวิธีการเข้าถึง การเพิ่ม "การสร้างเนื้อหาโดยมีวัตถุประสงค์หลักเพื่อจัดการอันดับในผลการค้นหาเป็นการละเมิดนโยบายสแปมของเรา"

การต่อสู้กับการจัดการ SERP เป็นสิ่งที่ Google มีประสบการณ์หลายปี โดยอ้างว่าความก้าวหน้าของระบบ เช่น SpamBrain ทำให้ 99% ของการค้นหา "ปราศจากสแปม" ซึ่งจะรวมถึง UGC สแปม การคัดลอก การปิดบัง และรูปแบบต่างๆ ของเนื้อหาทั้งหมด รุ่น.

หลายคนทำการทดสอบเพื่อดูว่า Google ตอบสนองต่อเนื้อหา AI อย่างไร และพวกเขาให้ความสำคัญกับคุณภาพอย่างไร

ก่อนเปิดตัว ChatGPT ฉันได้สร้างเว็บไซต์ที่มีเนื้อหา 10,000 หน้าซึ่งส่วนใหญ่สร้างขึ้นโดยโมเดล GPT3 ที่ไม่มีการควบคุมดูแล โดยตอบคำถามเกี่ยวกับวิดีโอเกม ด้วย

ด้วยลิงก์ที่น้อยที่สุด ไซต์ได้รับการจัดทำดัชนีอย่างรวดเร็วและเติบโตอย่างต่อเนื่อง โดยมีผู้เยี่ยมชมหลายพันคนต่อเดือน

ระหว่างการอัปเดตระบบของ Google สองครั้งในปี 2022 การอัปเดตเนื้อหาที่เป็นประโยชน์และการอัปเดตสแปมในภายหลัง Google ระงับเว็บไซต์โดยกะทันหันและเกือบทั้งหมด

*ข้อมูล Google Search Console จากเว็บไซต์ทดสอบ AI*

คงจะผิดที่จะสรุปว่า "เนื้อหา AI ไม่ทำงาน" จากการทดลองดังกล่าว

อย่างไรก็ตาม สิ่งนี้แสดงให้ฉันเห็นว่าในช่วงเวลานั้น Google:

ไม่ได้จัดประเภทเนื้อหา GPT-3 ที่ไม่มีการควบคุมดูแลว่าเป็น "คุณภาพ"
สามารถตรวจจับและลบผลลัพธ์ดังกล่าวด้วยสัญญาณอื่นๆ

เพื่อให้ได้คำตอบที่ดีที่สุด คุณต้องมีคำถามที่ดีกว่านี้

ตามหลักเกณฑ์ของ Google สิ่งที่เรารู้เกี่ยวกับระบบการค้นหา การทดลอง SEO และสามัญสำนึก "เครื่องมือค้นหาสามารถตรวจจับเนื้อหา AI ได้หรือไม่" น่าจะเป็นคำถามที่ผิด

ที่ดีที่สุดคือมุมมองระยะสั้นมาก

ในหัวข้อส่วนใหญ่ LLM ประสบปัญหาในการผลิตเนื้อหา "คุณภาพสูง" อย่างสม่ำเสมอในแง่ของความถูกต้องตามข้อเท็จจริงและตรงตามเกณฑ์ EEAT ของ Google แม้ว่าจะมีการเข้าถึงเว็บสดสำหรับข้อมูลนอกเหนือจากข้อมูลการฝึกอบรมก็ตาม

AI กำลังสร้างความก้าวหน้าครั้งสำคัญในการสร้างคำตอบสำหรับข้อความค้นหาที่ก่อนหน้านี้ขาดแคลนเนื้อหา แต่เนื่องจาก Google ตั้งเป้าหมายระยะยาวที่สูงขึ้นกับ SGE แนวโน้มนี้อาจจางหายไป

โฟกัสนี้คาดว่าจะกลับมาที่เนื้อหาผู้เชี่ยวชาญในรูปแบบที่ยาวขึ้น ด้วยระบบความรู้ของ Google ที่ให้คำตอบเพื่อตอบสนองคำถามหางยาวๆ แทนที่จะนำผู้ใช้ไปยังไซต์ขนาดเล็กจำนวนมาก

ความคิดเห็นที่แสดงในบทความนี้เป็นความคิดเห็นของผู้เขียนรับเชิญและไม่จำเป็นต้องเป็น Search Engine Land ผู้เขียนเจ้าหน้าที่อยู่ที่นี่

เพิ่ม Search Engine Land ในฟีด Google News ของคุณ