5 modi per utilizzare il sito Web di archivio Internet?
Pubblicato: 2021-10-25Internet Archive è una biblioteca digitale senza scopo di lucro che ha la più grande collezione di risorse online. È stato avviato nel 1996 e afferma di avere l'archiviazione di oltre 600 miliardi di pagine Web utilizzando WaybackMachine. Puoi utilizzare queste pagine archiviate in diversi modi per il tuo progetto. In questo articolo, spiegheremo come utilizzare i contenuti di Internet Archive e inviare il tuo sito Web per l'archiviazione.
Contenuto dell'archivio Internet
Molte persone pensano che arhive.org ospiti solo pagine web archiviate. Tuttavia, oltre alle pagine web, puoi trovare libri, audio, video, software e immagini dal loro sito web. Ecco alcuni dei modi in cui puoi utilizzare il sito Web di Internet Archive.
1. Trova il contenuto cancellato e non disponibile della tua pagina web
Il modo semplice e più utile di Internet Archive è trovare il contenuto che non è attualmente disponibile sul web. Spieghiamolo con un esempio. Alcuni costruttori di siti Web come Weebly non offrono un'opzione per mantenere i tuoi articoli nel "Cestino". Se hai cancellato per errore una pagina, verrà eliminato definitivamente dal tuo sito. Il problema è che la loro pagina del blog è la pagina dell'indice e l'eliminazione di quella singola pagina del blog rimuoverà definitivamente tutti i post del blog che hai creato per anni. Uno dei nostri lettori ci ha inviato un'e-mail chiedendoci come recuperare più di 100 post del blog Weebly poiché ha cancellato per errore la pagina dell'indice del blog.
Guardare Internet Archive è l'opzione più semplice per recuperare i contenuti eliminati. Sebbene Internet Archive non fornisca una soluzione rapida, almeno puoi visualizzare e recuperare i tuoi contenuti dalle pagine archiviate.
- Vai alla sezione WaybackMachine del sito Internet Archive.
- Inserisci l'URL del sito o della pagina di cui desideri visualizzare la cronologia e fai clic sul pulsante "Cronologia di navigazione".
- Vedrai un calendario con le date evidenziate che indicano che ci sono archivi disponibili in quelle date.
- Fare clic sulla data e selezionare l'istantanea che si desidera visualizzare.
- Puoi vedere il contenuto della pagina web nella data selezionata. È possibile modificare la data nella barra in alto per cambiare l'istantanea in una data diversa.
- Ora puoi copiare e utilizzare il contenuto se lo hai cancellato o modificato erroneamente sul tuo sito live.
Oltre alla visualizzazione come calendario, è possibile modificare la visualizzazione in Raccolte, Modifiche, Riepilogo, Mappa del sito e URL. Sarai sorpreso di vedere la quantità di informazioni disponibili sul tuo sito in Internet Archive. Di seguito è riportato come apparirà la vista "Mappa del sito" e puoi passare il mouse sopra il grafico per selezionare un URL per visualizzare l'istantanea.
Le istantanee possono essere utili anche per la documentazione quando si desidera scoprire come appariva un determinato sito dieci anni fa. Ad esempio, di seguito è riportato l'aspetto del sito di Google nel 1999.
Offerta SEO: ottimizza il tuo sito con la speciale prova gratuita di 14 giorni di Semrush Pro.
2. Invia la tua istantanea del sito
È anche possibile salvare il contenuto di una pagina Web in Internet Archive. Puoi inviare il tuo sito o qualsiasi pagina che ti piace sul web e trovare non è disponibile nel sito web archive.org.
- Vai alla sezione web di Internet Archive e scorri un po' verso il basso.
- Vedrai un'opzione "Salva pagina ora" come mostrato di seguito.
- Inserisci il tuo URL e fai clic sul pulsante "Salva pagina" per acquisire l'istantanea corrente della pagina.
3. Visualizza e ascolta dalle raccolte
Come accennato, le pagine Web sono solo una parte del sito Web di Internet Archive. Ci sono una vasta collezione di eBook, audio e video che puoi leggere o ascoltare online.
- Quando ti trovi nella home page di Internet Archive, scorri verso il basso e fai clic sulla tua raccolta preferita.
- Ad esempio, puoi trovare le "Biblioteche europee" e fare clic su di esso.
- Troverai più di 700K libri digitali e fai clic sul libro che desideri leggere o ascoltare.
- Si aprirà con un'interfaccia di lettura di eBook; puoi semplicemente ingrandire o passare alla visualizzazione di una pagina per ingrandire il libro e leggerlo online. È anche possibile leggere il libro per te e ascoltarlo mentre svolgi un'altra attività.
Puoi persino trovare libri pubblicati durante il 1900 che sono difficili da trovare nelle biblioteche fisiche.
4. Controlla i progetti di archivio Internet
Internet Archive ha molti progetti utili e puoi utilizzarli a seconda delle tue necessità.
- Le organizzazioni possono utilizzare l'archiviazione come servizio in abbonamento dal progetto arhive-it.org parte di Internet Archive.
- Prendi in prestito il libro dal loro progetto openlibrary.org.
- Ottieni l'archivio del tuo software preferito.
Puoi controllare la loro pagina dei progetti per ottenere maggiori dettagli sui progetti attuali.
5. Ricostruisci il tuo sito web dall'archivio
La gestione di un sito Web richiede molta pazienza e molti blogger eliminano il proprio sito nel mezzo e abbandonano il blog per la frustrazione di non ottenere traffico sufficiente. Tuttavia, dopo qualche tempo si pentono e non trovano modo di continuare il loro viaggio nel blog. Se sei tu quello che ha cancellato il tuo sito, non preoccuparti!!! Esistono molti fornitori di servizi di terze parti che possono aiutarti a ricostruire il tuo sito dal contenuto di Internet Archive. Devi pagare una tariffa nominale per il recupero dei contenuti e il ripristino nel formato richiesto. Ad esempio, puoi ricostruire il tuo blog WordPress originale per soli $ 45 e continuare da dove eri rimasto.
Controlla l'elenco dei fornitori di servizi di ricostruzione in questa pagina di Internet Archive.
Blocco di WaybackMachine Crawler
Infine, ci sono buone ragioni per cui potresti non volere che il contenuto del tuo sito web faccia parte di Internet Archive. Probabilmente vuoi mantenere il sito personale o scoprire che sono archiviate alcune informazioni sensibili che hai eliminato dal tuo sito. L'opzione più semplice è utilizzare il file robots.txt e bloccare l'accesso del crawler di Internet Archive. Aggiungi le seguenti righe nel tuo file robots.txt per impedire l'archiviazione dell'intero sito.
User-agent: ia_archiver Disallow: /
L'opzione alternativa è contattarli tramite e-mail e richiedere l'esclusione.
Domande frequenti sull'utilizzo di Internet Archive
Sì, se la tua pagina è stata precedentemente archiviata.
Sì, puoi trovare la versione storica chiamata snapshot se è disponibile.
Sì, puoi semplicemente andare alla sezione WaybackMachine e salvare il contenuto della tua pagina.
No, per visualizzare le istantanee. Tuttavia, ne hai bisogno per caricare le tue risorse.
Blocca il sito o la pagina con robots.txt o contattalo tramite e-mail per l'esclusione del sito.
Cattiva idea, anche un semplice verificatore di plagio confronterà il contenuto disponibile da Internet Archive. Molto probabilmente riceverai un avviso di violazione del copyright (DMCA) dopo aver trascorso molto tempo o verrai penalizzato dai motori di ricerca per aver rubato il contenuto di altri. Se è il tuo sito, puoi ricostruirlo da solo o utilizzando servizi di terze parti. Per scopi SEO, potrebbe essere necessario configurare i reindirizzamenti se mantieni ancora il vecchio nome di dominio.
Ampia raccolta di eBook, audio, video, software e molto altro.
Le pagine archiviate sono semplicemente istantanee come uno screenshot. Non è possibile effettuare il login, accedere al database, visualizzare i contenuti protetti da password.