Știri SEO pe care le puteți folosi: Vă prezentăm GPTBot, crawlerul web al OpenAI

Publicat: 2023-08-14

Dacă există un lucru pe care majoritatea utilizatorilor ChatGPT își doresc, acesta ar fi inteligența artificială sau conținutul AI actualizat și mai precis. Ei bine, OpenAI a muncit din greu pentru ca acest lucru să se întâmple. Recent, gigantul tehnologic a lansat documentație despre propriul său crawler web.

Denumit GPTBot, OpenAI intenționează să folosească acest crawler pentru a ajuta„modelele AI să devină mai precise și să își îmbunătățească capacitățile generale și siguranța”.

Acest lucru se întâmplă pe fondul preocupărilor legate de confidențialitatea personală, ocolirea conținutului plătit și generarea de text dăunătoare. Pentru a rezolva această problemă, OpenAI asigură că GPTBot este filtrat pentru a evita accesarea cu crawlere a acestor tipuri de conținut. (Deși nu au divulgat cum funcționează acest lucru.)

GPTBot poate accesa conținutul site-ului dvs. cu acest agent de utilizator și acest șir din fișierul robots.txt:

Indicativ agent de utilizator : GPTBot

Șir complet de agent de utilizator : Mozilla/5.0 AppleWebKit/537.36 (KHTML, cum ar fi Gecko; compatibil; GPTBot/1.0; +https://openai.com/gptbot)

Cu toate acestea, dacă nu doriți ca GPTBot să obțină o privire asupra conținutului dvs., puteți introduce și această comandă în fișierul robots.txt:

Agent utilizator: GPTBot

Nu permite: /

De asemenea, puteți personaliza modul în care GPTBot vă poate accesa site-ul. Iată cum o poți face:

Agent utilizator: GPTBot

Permite: /director-1/

Nu permiteți: /directory-2/

Utilizarea acestei comenzi va permite GPTBot să acceseze numai anumite părți ale site-ului dvs.

Toate apelurile către site-uri web vor fi efectuate de la adresele IP OpenAI enumerate în documentația sa separată . Credem că aceste adrese IP vor crește în număr pe măsură ce GPTBot accesează cu crawlere mai multe site-uri web pe internet. Dacă sunteți interesat, iată adresele IP listate la momentul scrierii:

  • 20.15.240.64/28
  • 20.15.240.80/28
  • 20.15.240.96/28
  • 20.15.240.176/28
  • 20.15.241.0/28
  • 20.15.242.128/28
  • 20.15.242.144/28
  • 20.15.242.192/28
  • 40.83.2.64/28

Deci, care sunt avantajele de a permite accesul la GPTBot? În afară de modelele AI mai bune și mai sigure – GPT-5 este deja în lucru – nu există cu adevărat niciun beneficiu în a lăsa conținutul tău să fie terenul de antrenament al OpenAI. Dar aceasta ar trebui să fie o veste bună dacă folosiți conținutul AI și doriți ca acesta să fie mai precis și mai robust.

Odată cu mișcările recente ale Google de a folosi date accesibile publicului pentru antrenamentul AI, OpenAI nu va stăpâni și va vedea că avantajul său competitiv este distrus.

Desigur, nu există nicio garanție că aceste companii tehnologice vor scăpa de controlul asupra eticii și utilizării responsabile a conținutului online. Dar suntem încântați să vedem cât de departe va ajunge AI și cum va beneficia optimizarea pentru motoarele de căutare (SEO) de pe urma acestor progrese.

Citiți documentația completă GPTBot aici.

Mai multe știri SEO pe care le puteți folosi

Google anunță un cadru de clasare nou, mai ușor și mai convenabil : dacă v-ați săturat de actualizările constante și complexe ale algoritmului , nu se va opri curând.Dar de această dată, Google promite actualizări mai bune pentru clasamentul căutărilor fără a-și revizui în mod semnificativ algoritmii. Cercetătorii Google au lansat recent o lucrare care detaliază un nou cadru de ponderare numit TW-BERT. Acest cadru facilitează găsirea documentelor relevante pentru interogări și extinderea interogărilor. Pe baza constatărilor lor, TW-BERT combină eficiența metodelor de regăsire bazate pe statistici cu modelele de deep-learning mai orientate spre context. Această descoperire permite Google să aducă rezultate mai relevante la interogările de căutare. De asemenea, cadrul este ușor de implementat, ceea ce înseamnă că Google l-ar putea introduce în sistemul său fără probleme. Rămâne de văzut cum afectează acest lucru clasamentele de căutare. De fapt, încă nu știm dacă Google intenționează să-l folosească în viitor. Iată povestea completă din Search Engine Journal . Pentru întreaga lucrare de cercetare, faceți clic aici .

Animale de companie permise?Răspundeți la această întrebare cu acest nou atribut GBP : utilizatorul Twitter Claudia Tomina a distribuit o nouă funcție elegantă în Google Business Profiles. Denumit „Animale de companie”, acest atribut vă permite să afișați politica privind animalele de companie. Captura de ecran a lui Tomina arată că puteți indica doar dacă câinii sunt permisi în interiorul și în afara unității dvs. Dacă aveți politici separate pentru pisici, găini și alți însoțitori non-umani, va trebui să fiți atenți la o nouă actualizare GBP. Tomina a împărtășit, de asemenea, cum va fi afișată politica dvs. privind animalele de companie odată ce distribuiți acele informații. Am acoperit câteva actualizări utile GBP în ultimele săptămâni. ( Aici , aici și aici ) Speculăm că acest lucru are de-a face cu ajutorul oamenilor să distingă afacerile reale de cele false. Citiți mai multe de la Masa rotundă pentru motoarele de căutare .

Iată cum poți bloca Google să indexeze conținutul chatbotului AI : ești îngrijorat că Google te va clasa mai jos din cauza chatbot-ului tău AI?Nu ești singur, iar avocatul căutării Google, John Mueller, a postat un PSA despre asta. El vă împărtășește cum puteți bloca Google de la indexarea conținutului generat de chatbot-ul dvs. AI: (1) Folosiți un iframe robotizat, (2) utilizați un fișier sau o resursă JavaScript robotizat sau (3) utilizați un fragment de date. Cineva a subliniat că Googlebot, crawler-ul web al Google, nu trebuie să obțină aceste date. Mueller a răspuns că „Unele site-uri fac pagini în moduri ciudate... După cum vă puteți imagina, rezultatele pot fi puțin... incomode pentru toată lumea”.Pentru mai multe despre această poveste, citiți acest articol din Search Engine Journal .

Nu ar trebui să ștergeți conținutul mai vechi – Google : Lumea SEO este plină de dezvăluire recentă Gizmodo a tăierii masive a conținutului CNET pentru a-și îmbunătăți clasamentul în căutare.Potrivit Gizmodo,„compania a șters mici loturi de articole înainte de a doua jumătate a lunii iulie, dar apoi ritmul a crescut”.Într-o notă internă , CNET susține că aceasta este o inițiativă strategică periodică pentru a-și îmbunătăți autoritatea de domeniu. Google Search Liaison a postat și pe Twitter despre asta :„Ștergeți conținut de pe site-ul dvs. pentru că credeți cumva că Google nu-i place conținutul „vechi”?Asta nu e un lucru!” Practic, nu ar trebui să ștergeți conținutul vechi doar din cauza vârstei lor. În schimb, ar trebui să te uiți la calitatea conținutului. Mai este de ajutor? Oferă în continuare valoare pentru cititorii tăi? Sigur, unele conținuturi vechi pot să nu mai fie benefice, dar unele sunt. Prin urmare, algoritmii de clasare ai Google nu vor privi vârsta conținutului dvs. ca un indicator al valorii acestuia. Prin urmare, cel mai bine este să vă evaluați conținutul pentru a vedea dacă este încă relevant și dacă respectă regulile Google EEAT și alte bune practici. Citiți acest articol Search Engine Land pentru mai multe informații.

Acum puteți măsura autoritatea mărcii cu Moz : ați fost vreodată curios despre cât de puternic este marca dvs. în spațiul online?Moz vă ajută să aruncați o privire la noua lor valoare numită Brand Authority. Lansată pentru testare beta în 7 august 2023, Brand Authority „vă poate ajuta să vă extindeți viziunea dincolo de SEO”, ceea ce înseamnă că acum puteți cuantifica modul în care celelalte campanii, cum ar fi PR, vă influențează marca mai mult decât doar clasamentele de căutare. Potrivit dr. Pete Meyers, om de știință de marketing la Moz,„Cu Brand Authority, putem înțelege în sfârșit cât de mult contează și punem acea putere să funcționeze.”Va fi aceasta o valoare utilă pentru proprietarii de web? Vom aștepta și vom vedea. Citiți întreaga poveste din Search Engine Land .

Nota editorului: „Știri SEO pe care le puteți folosi” este o postare săptămânală pe blog postată în fiecare luni dimineață numai peSEOblog.com, care prezintă toate știrile de top SEO din întreaga lume.Scopul nostru este de a face dinSEOblog.comun ghișeu unic pentru toți cei care caută știri SEO, educație și pentru a angaja un expert SEO cudirectorul nostru cuprinzător al agențiilor SEO.