5 วิธีในการใช้เว็บไซต์ Internet Archive?

เผยแพร่แล้ว: 2021-10-25

Internet Archive เป็นห้องสมุดดิจิทัลที่ไม่แสวงหาผลกำไรซึ่งมีคอลเลกชันเนื้อหาออนไลน์ที่ใหญ่ที่สุด เริ่มต้นขึ้นในปี 1996 และอ้างว่ามีที่เก็บถาวรของหน้าเว็บมากกว่า 600 พันล้านหน้าโดยใช้ WaybackMachine คุณสามารถใช้หน้าที่เก็บไว้เหล่านี้ในรูปแบบต่างๆ สำหรับโครงการของคุณ ในบทความนี้ เราจะอธิบายวิธีใช้งานเนื้อหา Internet Archive และส่งเว็บไซต์ของคุณเพื่อทำการเก็บถาวร

เนื้อหาที่เก็บถาวรทางอินเทอร์เน็ต

หลายคนคิดว่า arhive.org โฮสต์เฉพาะหน้าเว็บที่เก็บไว้ อย่างไรก็ตาม นอกจากหน้าเว็บแล้ว คุณสามารถค้นหาหนังสือ เสียง วิดีโอ ซอฟต์แวร์ และรูปภาพได้จากเว็บไซต์ของพวกเขา ต่อไปนี้คือบางวิธีที่คุณสามารถใช้เว็บไซต์ Internet Archive

1. ค้นหาเนื้อหาที่ถูกลบและไม่พร้อมใช้งานของหน้าเว็บของคุณ

วิธีที่ง่ายและมีประโยชน์มากที่สุดของ Internet Archive คือการค้นหาเนื้อหาที่ไม่มีอยู่บนเว็บในปัจจุบัน ให้เราอธิบายสิ่งนี้ด้วยตัวอย่าง ผู้สร้างเว็บไซต์บางรายเช่น Weebly ไม่มีตัวเลือกให้เก็บบทความของคุณไว้ใน "ถังขยะ" จะหายไปจากไซต์ของคุณอย่างถาวรหากคุณลบหน้าโดยไม่ได้ตั้งใจ ปัญหาคือหน้าบล็อกของพวกเขาคือหน้าดัชนี และการลบหน้าบล็อกเดียวนั้นจะเป็นการลบบล็อกโพสต์ทั้งหมดที่คุณสร้างมานานหลายปีออกอย่างถาวร ผู้อ่านรายหนึ่งของเราส่งอีเมลถึงเราเพื่อสอบถามวิธีดึงข้อมูลบล็อกโพสต์ของ Weebly มากกว่า 100 รายการ เนื่องจากเขาลบหน้าดัชนีบล็อกโดยไม่ได้ตั้งใจ

การดู Internet Archive เป็นตัวเลือกที่ง่ายที่สุดในการดึงเนื้อหาที่ถูกลบ แม้ว่า Internet Archive จะไม่ให้วิธีแก้ปัญหาอย่างรวดเร็ว แต่อย่างน้อย คุณสามารถดูและเรียกเนื้อหาของคุณจากหน้าที่เก็บไว้ได้

  • ไปที่ส่วน WaybackMachine ของเว็บไซต์ Internet Archive
  • ป้อน URL ของไซต์หรือหน้าที่คุณต้องการดูประวัติและคลิกปุ่ม "เรียกดูประวัติ"
ป้อน URL ในเครื่อง Wayback
ป้อน URL ในเครื่อง Wayback
  • คุณจะเห็นปฏิทินที่ไฮไลต์วันที่ระบุว่ามีเอกสารสำคัญสำหรับวันที่เหล่านั้น
  • คลิกวันที่และเลือกสแน็ปช็อตที่คุณต้องการดู
เลือกวันที่สแนปชอต
เลือกวันที่สแนปชอต
  • คุณสามารถดูเนื้อหาของหน้าเว็บในวันที่เลือก คุณสามารถเปลี่ยนวันที่บนแถบด้านบนเพื่อเปลี่ยนสแนปชอตเป็นวันที่อื่น
ดูสแนปชอตที่เก็บถาวร
ดูสแนปชอตที่เก็บถาวร
  • ตอนนี้คุณสามารถคัดลอกและใช้เนื้อหาได้ หากคุณลบหรือแก้ไขเนื้อหาบนไซต์ที่ใช้งานจริงของคุณอย่างไม่ถูกต้อง

นอกจากการดูเป็นปฏิทินแล้ว คุณยังสามารถเปลี่ยนมุมมองเป็นคอลเลกชัน การเปลี่ยนแปลง สรุป แผนผังเว็บไซต์ และ URL คุณจะประหลาดใจเมื่อเห็นข้อมูลจำนวนที่มีอยู่เกี่ยวกับไซต์ของคุณใน Internet Archive ด้านล่างนี้คือลักษณะของมุมมอง "แผนผังเว็บไซต์" และคุณสามารถวางเมาส์เหนือแผนภูมิเพื่อเลือก URL เพื่อดูภาพรวมได้

เก็บถาวร Site Map View
เก็บถาวร Site Map View

สแนปชอตยังมีประโยชน์สำหรับเอกสารประกอบเมื่อคุณต้องการค้นหาว่าไซต์ใดมองย้อนกลับไปเมื่อทศวรรษที่แล้ว ตัวอย่างเช่น ด้านล่างนี้คือรูปลักษณ์ของเว็บไซต์ Google ในปี 2542

เว็บไซต์ Google 1999
เว็บไซต์ Google 1999

ข้อเสนอ SEO: เพิ่มประสิทธิภาพเว็บไซต์ของคุณด้วยการทดลองใช้งานฟรี 14 วันพิเศษของ Semrush Pro

2. ส่งภาพรวมเว็บไซต์ของคุณ

นอกจากนี้ยังสามารถบันทึกเนื้อหาเว็บเพจลงใน Internet Archive ได้อีกด้วย คุณสามารถส่งไซต์ของคุณเองหรือหน้าใดๆ ที่คุณต้องการบนเว็บ และค้นหาไม่พบในเว็บไซต์ archive.org

  • ไปที่ส่วนเว็บของ Internet Archive และเลื่อนลงมาเล็กน้อย
  • คุณจะเห็นตัวเลือก “บันทึกหน้าทันที” ดังที่แสดงด้านล่าง
  • ป้อน URL ของคุณและคลิกปุ่ม "บันทึกหน้า" เพื่อจับภาพสแนปชอตปัจจุบันของหน้า
บันทึกหน้าใน Internet Archive
บันทึกหน้าใน Internet Archive

3. ดูและฟังจากคอลเล็กชัน

ดังที่กล่าวไว้ หน้าเว็บเป็นเพียงส่วนหนึ่งของเว็บไซต์ Internet Archive มี eBooks เสียง และวิดีโอจำนวนมากที่คุณสามารถอ่านหรือฟังออนไลน์ได้

  • เมื่อคุณอยู่ในหน้าแรกของ Internet Archive ให้เลื่อนลงและคลิกที่คอลเลกชันที่คุณชื่นชอบ
  • ตัวอย่างเช่น คุณสามารถค้นหา “ห้องสมุดยุโรป” และคลิกที่มัน
ดูคอลเลกชั่น
ดูคอลเลกชั่น
  • คุณจะพบหนังสือดิจิทัลมากกว่า 700K และคลิกบนหนังสือที่คุณต้องการอ่านหรือฟัง
  • จะเปิดขึ้นด้วยอินเทอร์เฟซตัวอ่าน eBook คุณสามารถซูมเข้าหรือเปลี่ยนเป็นมุมมองหน้าเดียวเพื่อขยายหนังสือและอ่านออนไลน์ได้ นอกจากนี้ยังสามารถอ่านหนังสือสำหรับคุณและฟังในขณะที่คุณทำงานอื่นได้อีกด้วย
อ่านหนังสือออนไลน์
อ่านหนังสือออนไลน์

คุณยังสามารถหาหนังสือที่ตีพิมพ์ในช่วงทศวรรษ 1900 ซึ่งหาได้ยากในห้องสมุดจริง

4. ตรวจสอบโครงการคลังข้อมูลทางอินเทอร์เน็ต

Internet Archive มีโปรเจ็กต์ที่มีประโยชน์มากมาย และคุณสามารถใช้มันได้ขึ้นอยู่กับความต้องการของคุณ

  • องค์กรสามารถใช้เอกสารนี้เป็นบริการสมัครรับข้อมูลจากส่วนโครงการ arhive-it.org ของ Internet Archive
  • ยืมหนังสือจากโครงการ openlibrary.org
  • รับไฟล์เก็บถาวรของซอฟต์แวร์โปรดของคุณ

คุณสามารถตรวจสอบหน้าโครงการเพื่อดูรายละเอียดเพิ่มเติมเกี่ยวกับโครงการปัจจุบัน

5. สร้างเว็บไซต์ของคุณใหม่จากที่เก็บถาวร

การดำเนินการเว็บไซต์ต้องใช้ความอดทนอย่างมาก และบล็อกเกอร์จำนวนมากลบไซต์ของตนในระหว่างนั้นและออกจากบล็อกเพราะหงุดหงิดที่ไม่ได้รับการเข้าชมเพียงพอ อย่างไรก็ตาม หลังจากผ่านไประยะหนึ่งพวกเขาก็รู้สึกเสียใจและหาวิธีเขียนบล็อกต่อไปไม่ได้ หากคุณเป็นคนหนึ่งที่ลบไซต์ของคุณ ไม่ต้องกังวล!!! มีผู้ให้บริการบุคคลที่สามจำนวนมากที่สามารถช่วยคุณสร้างไซต์ของคุณใหม่จากเนื้อหา Internet Archive คุณต้องจ่ายค่าธรรมเนียมเล็กน้อยสำหรับการดึงเนื้อหาและกู้คืนกลับในรูปแบบที่กำหนด ตัวอย่างเช่น คุณสามารถสร้างบล็อก WordPress เดิมของคุณใหม่ได้ในราคาเพียง $45 และไปต่อจากที่ค้างไว้

ราคาสร้างใหม่ที่เก็บถาวร
ราคาสร้างใหม่ที่เก็บถาวร

ตรวจสอบรายชื่อผู้ให้บริการสร้างใหม่ในหน้า Internet Archive

การบล็อก WaybackMachine Crawler

สุดท้าย มีเหตุผลที่ดีที่คุณอาจไม่ต้องการให้เนื้อหาของเว็บไซต์ของคุณเป็นส่วนหนึ่งของ Internet Archive อาจเป็นไปได้ว่าคุณต้องการทำให้ไซต์เป็นส่วนตัวหรือค้นหาข้อมูลที่ละเอียดอ่อนถูกเก็บถาวรซึ่งคุณลบออกจากไซต์ของคุณ ตัวเลือกที่ง่ายคือการใช้ไฟล์ robots.txt และบล็อกการเข้าถึงโปรแกรมรวบรวมข้อมูลของ Internet Archive เพิ่มบรรทัดต่อไปนี้ในไฟล์ robots.txt เพื่อบล็อกทั้งเว็บไซต์ไม่ให้เก็บถาวร

 User-agent: ia_archiver Disallow: /

อีกทางเลือกหนึ่งคือติดต่อพวกเขาทางอีเมลและขอยกเว้น


คำถามที่พบบ่อยเกี่ยวกับการใช้ Internet Archive

1. ฉันสามารถค้นหาหน้าเว็บที่ถูกลบของฉันได้หรือไม่?

ใช่ ถ้าหน้าของคุณถูกเก็บถาวรก่อนหน้านี้

2. ฉันสามารถค้นหาหน้าสดของฉันใน Internet Archive ได้หรือไม่?

ใช่ คุณสามารถค้นหาเวอร์ชันย้อนหลังที่เรียกว่าสแน็ปช็อตได้หากมีให้ใช้งาน

3. เป็นไปได้ไหมที่จะส่งหน้าของฉันไปเก็บถาวร?

ได้ คุณสามารถไปที่ส่วน WaybackMachine และบันทึกเนื้อหาในหน้าของคุณ

4. ฉันจำเป็นต้องเข้าสู่ระบบเพื่อเข้าใช้งาน Internet Archive หรือไม่?

ไม่ สำหรับการดูสแนปชอต อย่างไรก็ตาม คุณต้องมีหนึ่งอันในการอัปโหลดเนื้อหาของคุณ

5. ฉันจะลบเพจหรือไซต์ของฉันได้อย่างไร

บล็อกเว็บไซต์หรือหน้าด้วย robots.txt หรือติดต่อผ่านอีเมลเพื่อยกเว้นเว็บไซต์

6. ฉันสามารถคัดลอกเนื้อหาจากเว็บไซต์ของผู้อื่นที่มีอยู่ใน Internet Archive ได้หรือไม่

เป็นความคิดที่ไม่ดี แม้แต่เครื่องมือตรวจสอบการลอกเลียนแบบทั่วไปก็ยังเปรียบเทียบเนื้อหาที่มีจาก Internet Archive ส่วนใหญ่คุณอาจได้รับการแจ้งเรื่องการละเมิดลิขสิทธิ์ (DMCA) หลังจากใช้เวลามากหรือถูกเสิร์ชเอ็นจิ้นสำหรับการขโมยเนื้อหาของผู้อื่น หากเป็นไซต์ของคุณเอง คุณสามารถสร้างตัวเองใหม่หรือใช้บริการของบุคคลที่สามได้ เพื่อวัตถุประสงค์ในการทำ SEO คุณอาจต้องตั้งค่าการเปลี่ยนเส้นทางหากคุณยังคงใช้ชื่อโดเมนเดิม

7. ทรัพย์สินอื่นใดที่มีอยู่ในเอกสารสำคัญ?

คอลเลกชันขนาดใหญ่ของ eBooks ไฟล์เสียง วิดีโอ ซอฟต์แวร์ และอื่นๆ อีกมากมาย

8. เหตุใดฉันจึงไม่สามารถเข้าสู่ระบบเว็บไซต์ที่เก็บถาวรได้

หน้าที่เก็บไว้เป็นเพียงสแนปชอตเหมือนภาพหน้าจอ คุณไม่สามารถเข้าสู่ระบบ เข้าถึงฐานข้อมูล ดูเนื้อหาหลังการป้องกันด้วยรหัสผ่าน