5 maneiras de usar o site de arquivo da Internet?

Publicados: 2021-10-25

Internet Archive é uma biblioteca digital sem fins lucrativos que possui a maior coleção de ativos online. Foi iniciado em 1996 e afirma ter o arquivo de mais de 600 bilhões de páginas da web usando sua WaybackMachine. Você pode fazer uso dessas páginas arquivadas de diferentes maneiras para o seu projeto. Neste artigo, explicaremos como usar o conteúdo do Internet Archive e enviar seu site para arquivamento.

Conteúdo de arquivo da Internet

Muitas pessoas pensam que o arhive.org hospeda apenas páginas da web arquivadas. No entanto, além das páginas da web, você pode encontrar livros, áudio, vídeo, software e imagens em seu site. Aqui estão algumas maneiras de usar o site Internet Archive.

1. Encontre conteúdo excluído e indisponível de sua página da web

A forma simples e mais útil de Internet Archive é encontrar o conteúdo que não está disponível atualmente na web. Vamos explicar isso com um exemplo. Alguns construtores de sites como o Weebly não oferecem a opção de manter seus artigos na “Lixeira”. Ele será removido permanentemente do seu site se você tiver excluído uma página por engano. O problema é que a página do blog deles é a página de índice e a exclusão dessa única página do blog removerá permanentemente todas as postagens de blog que você criou durante anos. Um de nossos leitores nos envia um e-mail perguntando como recuperar mais de 100 postagens de blog do Weebly, pois ele apagou por engano a página de índice do blog.

Olhar para o Internet Archive é a opção mais simples para recuperar conteúdo excluído. Embora o Internet Archive não forneça uma solução rápida, pelo menos você pode visualizar e recuperar seu conteúdo das páginas arquivadas.

  • Vá para a seção WaybackMachine do site Internet Archive.
  • Insira o site ou URL da página cujo histórico deseja ver e clique no botão “Navegar no histórico”.
Insira o URL na máquina de wayback
Insira o URL na máquina de wayback
  • Você verá um calendário com as datas destacadas, indicando que há arquivos disponíveis nessas datas.
  • Clique na data e selecione o instantâneo que deseja visualizar.
Escolha a data do instantâneo
Escolha a data do instantâneo
  • Você pode ver o conteúdo da página da web na data selecionada. Você pode alterar a data na barra superior para alterar o instantâneo para uma data diferente.
Ver instantâneo arquivado
Ver instantâneo arquivado
  • Agora, você pode copiar e usar o conteúdo se tiver excluído ou modificado indevidamente em seu site ativo.

Além de visualizar como um calendário, você pode alterar a visualização para Coleções, Mudanças, Resumo, Mapa do site e URL. Você ficará surpreso ao ver a quantidade de informações disponíveis sobre o seu site no Internet Archive. Abaixo está a aparência da visualização “Mapa do site” e você pode passar o mouse sobre o gráfico para selecionar um URL para visualizar o instantâneo.

Arquivo Vista do Mapa do Site
Arquivo Vista do Mapa do Site

Os instantâneos também podem ser úteis para documentação quando você quiser saber como era a aparência de um determinado site há uma década. Por exemplo, abaixo está a aparência do site do Google em 1999.

Site do Google 1999
Site do Google 1999

Oferta de SEO: Otimize seu site com o Semrush Pro de avaliação gratuita especial de 14 dias.

2. Envie o instantâneo do seu site

Também é possível salvar o conteúdo de uma página da web no Internet Archive. Você pode enviar seu próprio site ou qualquer página que desejar na web e descobrir que não está disponível no site archive.org.

  • Vá para a seção da Web do Internet Archive e role um pouco para baixo.
  • Você verá uma opção “Salvar página agora” conforme mostrado abaixo.
  • Insira seu URL e clique no botão “Salvar página” para capturar o instantâneo atual da página.
Salvar página no arquivo da Internet
Salvar página no arquivo da Internet

3. Veja e ouça coleções

Conforme mencionado, as páginas da web são apenas parte do site Internet Archive. Há uma grande coleção de eBooks, áudio e vídeos que você pode ler ou ouvir online.

  • Quando você estiver na página inicial do Internet Archive, role para baixo e clique em sua coleção favorita.
  • Por exemplo, você pode encontrar as “Bibliotecas Européias” e clicar nelas.
Ver coleções
Ver coleções
  • Você encontrará mais de 700 mil livros digitais e clique no livro que deseja ler ou ouvir.
  • Ele será aberto com uma interface de leitor de e-book; você pode simplesmente aumentar o zoom ou mudar para a visualização de uma página para ampliar o livro e ler online. Também é possível ler o livro para você e ouvir enquanto você faz outra tarefa.
Leia livros online
Leia livros online

Você pode até encontrar livros publicados durante 1900 que são difíceis de encontrar em bibliotecas físicas.

4. Verifique os projetos de arquivo da Internet

O Internet Archive possui muitos projetos úteis e você pode utilizá-los de acordo com sua necessidade.

  • As organizações podem usar o arquivamento como um serviço de assinatura do projeto arhive-it.org, parte do Internet Archive.
  • Pegue o livro emprestado de seu projeto openlibrary.org.
  • Obtenha o arquivo do seu software favorito.

Você pode verificar a página de projetos para obter mais detalhes sobre os projetos atuais.

5. Reconstrua seu site a partir do arquivo

Gerenciar um site exige muita paciência e muitos blogueiros excluem seus sites no meio e param de blogar, frustrados por não obterem tráfego suficiente. No entanto, depois de algum tempo, eles se arrependem e não encontram maneira de continuar sua jornada como blog. Se foi você que deletou seu site, não se preocupe !!! Existem muitos provedores de serviços terceirizados que podem ajudá-lo a reconstruir seu site a partir do conteúdo do Internet Archive. Você tem que pagar uma taxa nominal para recuperação de conteúdo e restauração no formato exigido. Por exemplo, você pode reconstruir seu blog WordPress original por apenas US $ 45 e continuar de onde parou.

Preços de reconstrução de arquivo
Preços de reconstrução de arquivo

Verifique a lista de provedores de serviços de reconstrução nesta página do Internet Archive.

Bloqueando rastreador WaybackMachine

Finalmente, existem boas razões para você não querer que o conteúdo do seu site faça parte do Internet Archive. Provavelmente, você deseja manter o site pessoal ou encontrar algumas informações confidenciais arquivadas que você excluiu de seu site. A opção fácil é usar o arquivo robots.txt e bloquear o acesso do rastreador do Internet Archive. Adicione as seguintes linhas em seu arquivo robots.txt para bloquear o arquivamento de todo o site.

 User-agent: ia_archiver Disallow: /

A opção alternativa é contatá-los por e-mail e solicitar a exclusão.


FAQ sobre como usar o Internet Archive

1. Posso encontrar minha página da web excluída?

Sim, se sua página foi arquivada anteriormente.

2. Posso encontrar minha página ativa no Internet Archive?

Sim, você pode encontrar a versão histórica chamada instantâneo se estiver disponível.

3. É possível enviar manualmente minha página para arquivo?

Sim, você pode simplesmente ir para a seção WaybackMachine e salvar o conteúdo da página.

4. Eu preciso ter um acesso de login para Internet Archive?

Não, para visualizar instantâneos. No entanto, você precisa de um para fazer upload de seus ativos.

5. Como posso remover minha página ou site?

Bloqueie o site ou página com o robots.txt ou entre em contato com eles por e-mail para exclusão do site.

6. Posso descartar conteúdo de outro site disponível no Internet Archive?

Má ideia, mesmo um verificador de plágio simples irá comparar o conteúdo disponível no Internet Archive. Muito provavelmente, você receberá um aviso de violação de direitos autorais (DMCA) no futuro após gastar muito tempo ou será penalizado pelos motores de busca por roubar o conteúdo de terceiros. Se for seu próprio site, você pode reconstruí-lo ou usar serviços de terceiros. Para fins de SEO, pode ser necessário configurar redirecionamentos se você ainda tiver o nome de domínio antigo.

7. Quais outros ativos estão disponíveis no arquivo?

Grande coleção de eBooks, áudios, vídeos, software e muito mais.

8. Por que não consigo acessar o site arquivado?

As páginas arquivadas são simplesmente instantâneos, como uma captura de tela. Você não pode fazer o login, acessar o banco de dados, visualizar o conteúdo por trás da proteção por senha.