Novità SEO che puoi utilizzare: Presentazione di GPTBot, il web crawler di OpenAI
Pubblicato: 2023-08-14Se c'è una cosa che la maggior parte degli utenti di ChatGPT desidera, sarebbe un'intelligenza artificiale o un contenuto AI aggiornato e più accurato. Bene, OpenAI ha lavorato sodo per far sì che ciò accadesse. Proprio di recente, il gigante della tecnologia ha rilasciato la documentazione sul proprio web crawler.
Chiamato GPTBot, OpenAI prevede di utilizzare questo crawler per aiutare"i modelli AI a diventare più accurati e migliorare le loro capacità generali e sicurezza".
Questo è tra le preoccupazioni sulla privacy personale, il bypass dei contenuti a pagamento e la generazione di testo dannoso. Per risolvere questo problema, OpenAI assicura che GPTBot sia filtrato per evitare la scansione di questi tipi di contenuto. (Anche se non hanno divulgato come funziona.)
GPTBot può accedere ai contenuti del tuo sito web con questo user agent e stringa sul tuo file robots.txt:
Token dell'agente utente : GPTBot
Stringa user-agent completa : Mozilla/5.0 AppleWebKit/537.36 (KHTML, come Gecko; compatibile; GPTBot/1.0; +https://openai.com/gptbot)
Tuttavia, se non vuoi che GPTBot ottenga uno snoop dei tuoi contenuti, puoi anche inserire questo comando nel tuo file robots.txt:
Agente utente: GPTBot
Non consentire: /
Puoi anche personalizzare il modo in cui GPTBot può accedere al tuo sito web. Ecco come puoi farlo:
Agente utente: GPTBot
Consenti: /directory-1/
Non consentire: /directory-2/
L'utilizzo di questo comando consentirà a GPTBot di accedere solo a parti specifiche del tuo sito web.
Tutte le chiamate ai siti Web verranno effettuate dagli indirizzi IP OpenAI elencati nella sua documentazione separata . Riteniamo che questi indirizzi IP aumenteranno di numero man mano che GPTBot esegue la scansione di più siti Web su Internet. Se sei interessato, ecco gli indirizzi IP elencati al momento della scrittura:
- 20.15.240.64/28
- 20.15.240.80/28
- 20.15.240.96/28
- 20.15.240.176/28
- 20.15.241.0/28
- 20.15.242.128/28
- 20.15.242.144/28
- 20.15.242.192/28
- 40.83.2.64/28
Quindi, quali sono i vantaggi di consentire l'accesso a GPTBot? A parte modelli di intelligenza artificiale migliori e più sicuri – GPT-5 è già in lavorazione – non c'è davvero alcun vantaggio nel lasciare che i tuoi contenuti siano il campo di allenamento di OpenAI. Ma questa dovrebbe essere una buona notizia se stai sfruttando i contenuti AI e desideri che siano più accurati e robusti.
Con le recenti mosse di Google per utilizzare dati accessibili al pubblico per la formazione AI, OpenAI non starà a guardare il suo vantaggio competitivo essere consumato.
Naturalmente, non vi è alcuna garanzia che queste aziende tecnologiche sfuggano al controllo sull'etica e sull'uso responsabile dei contenuti online. Ma siamo entusiasti di vedere fino a che punto si spingerà l'intelligenza artificiale e in che modo l'ottimizzazione per i motori di ricerca (SEO) trarrà vantaggio da questi progressi.
Leggi la documentazione completa di GPTBot qui.
Altre notizie SEO che puoi utilizzare
Google annuncia un nuovo framework di ranking più semplice e conveniente : se sei stanco dei costanti e complessi aggiornamenti dell'algoritmo , non si fermerà presto.Ma questa volta, Google promette migliori aggiornamenti del ranking di ricerca senza rivedere in modo significativo i suoi algoritmi. I ricercatori di Google hanno recentemente pubblicato un documento che descrive in dettaglio un nuovo framework di ponderazione chiamato TW-BERT. Questo framework semplifica la ricerca di documenti rilevanti per le query e l'espansione delle query. Sulla base delle loro scoperte, TW-BERT combina l'efficienza dei metodi di recupero basati sulla statistica con i modelli di apprendimento profondo più orientati al contesto. Questa svolta consente a Google di fornire risultati più pertinenti alle query di ricerca. Inoltre, il framework è facile da implementare, il che significa che Google potrebbe inserirlo nel suo sistema senza problemi. Resta da vedere come questo influenzi le classifiche di ricerca. In effetti, dobbiamo ancora sapere se Google prevede di utilizzarlo in futuro. Ecco la storia completa da Search Engine Journal . Per l'intero documento di ricerca, fare clic qui .

Animali ammessi?Rispondi a questa domanda con questo nuovo attributo GBP : l'utente di Twitter Claudia Tomina ha condiviso una nuova funzionalità all'interno di Google Business Profiles. Chiamato "Animali domestici", questo attributo ti consente di visualizzare la tua politica sugli animali domestici. Lo screenshot di Tomina mostra che puoi solo indicare se i cani sono ammessi all'interno e all'esterno del tuo stabilimento. Se hai politiche separate per gatti, galline e altri compagni non umani, dovrai fare attenzione a un altro aggiornamento GBP. Tomina ha anche condiviso come verrà mostrata la tua politica sugli animali domestici una volta condivise tali informazioni. Abbiamo coperto diversi utili aggiornamenti GBP nelle ultime settimane. ( Qui , qui e qui ) Ipotizziamo che questo abbia a che fare con l'aiutare le persone a distinguere le imprese reali da quelle false. Ulteriori informazioni dalla Tavola rotonda sui motori di ricerca .
Ecco come puoi impedire a Google di indicizzare i contenuti del chatbot AI : sei preoccupato che Google ti classificherà più in basso a causa del tuo chatbot AI?Non sei solo e l'avvocato della ricerca di Google John Mueller ha pubblicato un PSA a riguardo. Condivide come puoi impedire a Google di indicizzare i contenuti generati dal tuo chatbot AI: (1) utilizzare un iframe robotizzato, (2) utilizzare un file o una risorsa JavaScript robotizzato o (3) utilizzare un data-nosnippet. Qualcuno ha sottolineato che Googlebot, il web crawler di Google, non dovrebbe ottenere questi dati. Mueller ha risposto che "Alcuni siti creano pagine in modi strani... Come puoi immaginare, i risultati possono essere un po'... scomodi per tutti".Per saperne di più su questa storia, leggi questo articolo di Search Engine Journal .
Non dovresti eliminare i contenuti più vecchi - Google : il mondo SEO è in fermento con la recente rivelazione di Gizmodo della massiccia potatura dei contenuti di CNET per migliorare le sue classifiche di ricerca.Secondo Gizmodo,"la società ha eliminato piccoli lotti di articoli prima della seconda metà di luglio, ma poi il ritmo è aumentato".In una nota interna , CNET afferma che si tratta di un'iniziativa strategica periodica per migliorare la propria autorità di dominio. Google Search Liaison ha anche twittato su questo :“Stai eliminando contenuti dal tuo sito perché in qualche modo ritieni che a Google non piacciano i contenuti “vecchi”?Non è una cosa! Fondamentalmente, non dovresti eliminare i vecchi contenuti solo a causa della loro età. Invece, dovresti guardare alla qualità del contenuto. È ancora utile? Fornisce ancora valore ai tuoi lettori? Certo, alcuni vecchi contenuti potrebbero non essere più utili, ma alcuni lo sono. Pertanto, gli algoritmi di ranking di Google non considereranno l'età dei tuoi contenuti come un indicatore del loro valore. Pertanto, è meglio valutare i tuoi contenuti per vedere se sono ancora pertinenti e conformi alle linee guida EEAT di Google e ad altre best practice. Leggi questo articolo di Search Engine Land per maggiori informazioni.
Ora puoi misurare l'autorità del marchio con Moz : sei mai stato curioso di sapere quanto è forte il tuo marchio nello spazio online?Moz ti aiuta a dare un'occhiata alla loro nuova metrica chiamata Brand Authority. Lanciato per il beta test lo scorso 7 agosto 2023, Brand Authority "può aiutarti ad espandere la tua visione oltre la SEO", il che significa che ora puoi quantificare in che modo le tue altre campagne, come le pubbliche relazioni, incidono sul tuo marchio più del semplice ranking di ricerca. Secondo il dottor Pete Meyers, uno scienziato di marketing di Moz,"Con la Brand Authority, possiamo finalmente capire quanto contano e mettere in pratica quel potere".Sarà una metrica utile per i proprietari di siti web? Aspetteremo e vedremo. Leggi la storia completa da Search Engine Land .
Nota del redattore: "SEO News You Can Use" è un post sul blog settimanale pubblicato ogni lunedì mattina solo suSEOblog.com, che raccoglie tutte le principali notizie SEO da tutto il mondo.Il nostro obiettivo è rendereSEOblog.comuno sportello unico per tutti coloro che cercano notizie SEO, istruzione e per assumere un esperto SEO con la nostradirectory completa di agenzie SEO.