Normal ifade kullanarak Google Arama Konsolu API'sinden en iyi şekilde nasıl yararlanılır

Yayınlanan: 2022-11-02

Google Search Console, gerçek kullanıcılar tarafından doğrudan Google'dan paha biçilmez arama verileri sağlayan harika bir araçtır. Grafikler ve tablolarla çalışmak kolay olsa da, verilerin büyük bir kısmına kullanıcı arayüzünden erişilemez.

Bu gizli verilere ulaşmanın tek yolu, API'yi kullanmak ve size sunulan tüm bu değerli arama verilerini - nasıl yapılacağını biliyorsanız - çıkarmaktır. Bu, düzenli ifadelerle mümkündür.

SMX Advanced'de konuşan bir PayPal Şirketi olan Honey'de Ürün Geliştirmeden Sorumlu Başkan Yardımcısı Eric Wu'ya göre, normal ifadeler kullanarak Google Arama Konsolu API'sini nasıl en üst düzeye çıkarabileceğiniz aşağıda açıklanmıştır.

GSC ile SEO sorunlarını teşhis etme

Durgun veya azalan bir büyüme ya da temel güncelleme düşüşü yaşayan bir web sitesinde mi çalışıyorsunuz?

Çoğu SEO uzmanı, bu tür sorunları teşhis etmek için Google Arama Konsolu'na (GSC) başvurur.

(Ya da kaynaklar izin verirse, Ryte gibi ücretli bir araç kullanabilir veya kendi platformunuzu oluşturabilirsiniz.)

Neyse ki SEO topluluğu için, GSC analizi için yararlı olan Looker Studio gösterge tabloları (eski adıyla Google Data Studio) sıkıntısı yoktur:

  • Aleyda Solis'in, Google Çekirdek Güncellemesinden son günlerde olası sıralama değişikliklerini kolayca belirlemek için GSC verilerini kullanan ücretsiz kontrol paneli.
  • Artık Keşfet ve Google Haberler trafik verilerini çeken Google'ın arama trafiği izleme panosu.
  • Hannah Butler'ın Arama Konsolu Explorer Studio. (Ayrıca, GSC verilerini uygulamalı olarak değiştirmek ve hızlı içgörüler bulmak istiyorsanız, Butler'ın Arama Konsolu Gezgini Sayfasını kullanabilirsiniz.)

Gösterge tabloları, ihtiyaç duyduğunuz verilere ulaşmak için GSC'yi kullanmak ve birden fazla tıklama yapmak yerine, SEO'ların farklı trendlere genel bir bakış atmasına olanak tanır.

Ancak kurumsal siteleri analiz ediyorsanız bazı engellerle karşılaşabilirsiniz.

  • Looker Studio ve Google E-Tablolar, özellikle büyük sitelerle uğraşırken yavaş yüklenir.
  • GSC'nin arayüzünün 1.000 satırlık bir dışa aktarma limiti vardır.
  • GSC'nin büyük bir örnekleme sorunu var. Benzer.ai'ye göre, kurumsal SEO ekipleri GSC anahtar kelimelerinin %90'ını kaçırıyor. Ve eğer verileri nasıl çıkaracağınızı biliyorsanız, aslında 14x anahtar kelime elde edebilirsiniz.

GSC'nin örnekleme probleminin üstesinden gelmek

Arama Gezgini, GSC analizi için kullanabileceğiniz başka bir araçtır. Noah Learner ve Two Octobers ekibinden, GSC'nin API'sini kullanan veri ardışık düzenleriyle oluşturulmuştur, bu daha sonra verileri BigQuery'ye gönderir (temelde Google E-Tablolar'ı atlayarak ve CSV dosyalarını indirerek) ve ardından bilgileri Data Studio ile görselleştirir.

Bununla, neredeyse tüm verilere ulaştığınızdan emin olabilirsiniz.

Özellikle çok sayıda farklı kategoriye sahip büyük e-ticaret siteleri için GSC'nin örnekleme sorunu nedeniyle hala bir uyarı var. GSC, bu dizinlerden gelen tüm verileri mutlaka göstermez.

GSC API'sinden en fazla veriyi elde etmek için çeşitli testler yaptıktan sonra, Similar.ai ekibi GSC örnekleme açığını kapatmanın bir yolunu keşfetti.

GSC gösterge tablonuza farklı profiller olarak daha fazla alt dizin ekleyerek, Google size bu alt düzeyde daha fazla bilgi verdiği için daha da fazla veri elde edebileceğinizi buldular.

benzer-ai-gsc-örnekleme-boşluğunu kapatma

Örneğin, example.com/televisions'a bakıyorsanız ve GSC profilinizde bir alt dizin olarak "televizyonlar" eklerseniz, Google size yalnızca o alt dizine ilişkin anahtar kelimeleri ve tıklama bilgilerini verir ve aşağı iner.

Ve bu farklı alt dizinlerin birçoğunu ekleyerek çok daha fazla bilgi çıkarabilirsiniz.

Bu, örnekleme sorununu çözer, ancak normal ifadeler kullanarak daha da fazla veri elde edebilirsiniz.

Normal ifadelerle daha fazla GSC verisi alma

Normal ifade veya normal ifade, verilerinizi anlamak için güçlü bir araçtır.

Nisan 2021'de Google, GSC'ye normal ifade desteği ekleyerek SEO'lara organik arama verilerini bölmek ve bölmek için daha fazla yol sağladı.

Çoğu zaman, anlamadığınız sürece veriler yararlı değildir. Normal ifade, GSC'nin zengin verilerinden eyleme dönüştürülebilir içgörüler çıkarmaya yardımcı olur.

Ancak ne kadar güçlü olursa olsun, normal ifadeyi öğrenmek zor olabilir.

Normal ifadeleri anlamak ve derinlemesine incelemek için en iyi yer, Google'ın GitHub'daki resmi belgeleridir. (Google, ürünlerinde düzenli ifadenin bir tadı olan RE2 kullanır.)

Normal ifade her türlü farklı programlama dilinde mevcut olsa da, .htaccess dosyalarını değiştirenler için bile onu hemen hemen her yerde bulacaksınız.

Sonraki birkaç bölümde, GSC için normal ifadeden yararlanmaya yönelik kullanım durumları yer almaktadır.

Normal ifade bilgi sorguları

GSC'deki gerçek bilgi arama sorgularına bakarken, genellikle şunları anlamak istersiniz:

  • İnsanlar sitenize gerçekte nasıl geliyor?
  • Hangi soruları çıkarıyorlar?

Bu şeylere tek seferlik bir bakış açısıyla bakmak, GSC içinde zor olabilir.

Her zaman “ne”, “nasıl”, “neden” ve ardından “ne zaman” kelimelerini arıyorsunuz.

Normal ifadeyle bilgi sorgularını çıkarmayı daha az sıkıcı hale getirmenin birkaç yolu vardır.

Daniel K. Cheung, "ne", "nasıl", "neden" ve "ne zaman" içeren tüm sorguları gösteren ve bir tıklama veya gösterim alan bir normal ifade dizesi paylaştı:

  • "what|how|why|when"

Ve Steve Toth tarafından paylaşılan bu normal ifade dizisi, önceki örneği bir adım yukarı taşıyor:

  • ^(who|what|where|when|why|how)[" "]

"Kim", "ne", "nerede", "ne zaman", "neden" ve "nasıl" ile başlayan ve ardından bir boşlukla devam eden soru tabanlı sorguları yakalamak istiyorsanız bu dizeyi kullanabilirsiniz.

Bu, bir soruyu başlatacak herhangi bir kelime türünü ararken kullanabileceğiniz harika bir liste:

  • vardır, olabilir, yapamaz, yapamaz, yapamadı, yaptı, yapmadı, yaptı, yaptı, yapmadı, nasıl, eğer, değil, olmamalı, olmamalı, değildi, değildi, vardı, değildi, ne, ne zaman, nerede, kim, kim, kimin, neden, olacak, olmayacak, olmayacak, olmayacak

Tüm bunları regex formuna koymak şuna benzer:

  • ^(are|can|can't|could|couldn't|did|didn't|do|does|doesn't|how|if|is|isn't|should|shouldn't|was|wasn't|were|weren't|what|when|where|who|whom|whose|why|will|won't|would|wouldn't)\s

Bu 178 karakterlik dizide:

  • Sorgunun bu kelimeyle başlaması gerektiğini söyleyen şapka ( ^ ) var:
  • Sözcükler virgül yerine çizgi ( | ) ile ayrılır.
  • Tüm kelimeler parantez içine alınır.
  • Kelimeden sonra bir boşluk belirten bir ters eğik çizgi ve “s” ( \s ) vardır.

Bu iyidir, ancak yapılması sıkıcı da olabilir.

Aşağıda, Wu, kopyalama ve yapıştırma için ideal olan daha regex dostu ve daha kısa olması için önceki kelime listesini basitleştirdi. Bu şekilde bakımı da verimliliğe yardımcı olur.

regex-sıkıştırılmış-kelimeler

İlk sütunda normal sözcükler ve ikinci sütunda sıkıştırılmış regex bulunur.

Örneğin, “can” kelimesi sıkıştırılmış can('t)? .

Soru işareti parantez içindeki her şeyin isteğe bağlı olduğunu gösterir. Sıkıştırılmış sözdizimi, hem "can" hem de "can't" kelimelerini kapsamanıza izin verir.

Daha ilginç olarak, bunu can/can't, must/should't ve will/would't ile yapabilirsiniz, kelimelerin -ould kısmının ortak taban olduğu yerde (c|sh|w)ould(n't)? gibi) (c|sh|w)ould(n't)? . Bu kısa dize, bu davaların altısını da kapsar.

Bu uzun kelime listesini basitleştirmek, dizeyi daha az okunabilir hale getirirken, harika olan şey, regex alanına daha fazla sığması ve daha kolay kopyalayıp yapıştırmanıza izin vermesidir.

  • ^(are|can('t)?|(c|sh|w)ould(n't)?|did(n't)?|do(es)?(n't)?|how|if|is(n't)?|was(n't)?|were(n't)?|wh(at|en|ere|y)who(m|se)?|will|won't)\s

Bir adım daha ileri giderseniz daha da sıkıştırabilirsiniz. Bu durumda Wu, karakter sayısını 135'ten 113 karaktere düşürdü.

  • ^(are|can('t)?|how|if|wh(at|en|ere|y)|who(m|se)?|will|won't|((c|sh|w)ould|did(n't)?|do(es)?|was|is|were)(n't)?)\s

Normal ifadeler gerçekten karmaşık olabilir. Başka birinden normal ifade dizesi alıyorsanız ve ne yaptığını netleştirmek istiyorsanız, görselleştirmenize yardımcı olması için Regexper'ı kullanabilirsiniz.

Aşağıda, farklı normal ifade dizesi sürümlerinin bir karşılaştırmasını göreceksiniz. İlkini sürdürmek daha kolaydır ve sonuncuyu sürdürmek ve okumak açıkçası daha zordur.

Ancak bazen karakter sayısı, özellikle daha uzun düzenli ifadeleriniz olduğunda gerçekten önemli olacaktır.

Google Arama Avukatı Daniel Waisberg'e göre GSC için normal ifade filtre sınırları 4.096 karakterdir.

Bu biraz gibi görünebilir. Ancak, bir e-ticaret siteniz varsa ve alan adları, alt alanlar veya daha uzun dizinler eklemeniz gerekiyorsa, büyük olasılıkla bu sınıra ulaşacaksınız.

Normal ifade markalı sorgular

GSC'de normal ifade karakter sınırına ulaşmaya başlayabileceğiniz başka bir örnek, markalı sorgular için kullandığınız zamandır.

Bir markanın bir kişinin yazabileceği tüm farklı yazım hatalarını düşündüğünüzde, bu 4.096 karakter sayısıyla çabucak karşılaşırsınız. Örneğin:

  • aamaung, damsung, mamsang, sam sung, samaung, samdung, samesung, sameung, samgsung, samgung, samsang, samsaung, samsgu, samshgg, samshng, samsing, samsnug, samssung, samsu, subsamgsu, , samsun g, samsunb, samsund, samsund, samsunh, samsunt…

Normal ifadeyi anlamanın yardımcı olduğu yer burasıdır. Bu dizeyle, "samsung" marka adını yazım hatalarıyla birlikte yakalayabilirsiniz:

  • (s+|a|d|z)[az\s]{1,4}m?[az\s]{1,6}(m|u|n|g|t|h|b|v)

Çoğu zaman, insanlar kelimenin orta kısımlarını yanlış yazacaktır. Ancak genel olarak, biçimi ve uzunluğu doğru buluyorlar ve sözdiziminize bu şekilde yaklaşabilirsiniz.

Marka sorgusu yazım hataları için aşağıdakileri göz önünde bulundurun:

  • Marka sorgusunu oluşturan ana harfler .
  • ünsüzler
  • Sert ünsüzleri çevreleyen harfler .

Kırmızı, insanların bir marka adını yazarken genellikle gözden kaçırmadıkları sert ünsüzlerdir. Bunlar, o markayı oluşturan ana harflerdir. “Samsung” için başlangıçta “s”, ortada “m” ve sonunda “n” ve “g”.

Klavyedeki bu ana ünsüzleri çevreleyen mavi harfler, insanların tipik olarak yanlış yazdığı harflerdir. Örnekte, “s” etrafında “a”, “d” ve “z”yi görüyorsunuz. (Uluslararası klavyeler için düzen farklı olsa da, konsept hala aynıdır.)

Yukarıdaki normal ifade dizisi, "samsung" un tüm olası türevlerini yakalar.

Buradaki diğer büyük numara [az\s]{1,4} .

Normal ifade biçiminde, bu temelde "a" ile "z" arasındaki herhangi bir harfi veya bir boşlukla bir ila dört kez eşleştirmek istiyorum" der.

Bu, bir kişinin potansiyel olarak aynı tuşa birden çok kez basabileceği veya yanlışlıkla boşluk tuşuna basabileceği bir marka sorgusunun ortasında meydana gelebilecek tüm o garip yazım hatalarını yakalar.

Ek olarak, marka adı belirli bir uzunluktadır (“samsung” yedi karakterden oluşur). İnsanlar muhtemelen 20-50 karakter yazmayacak.

Bu normal ifadede, "samsung"daki "s" ve "m" arasında birinin 1-4 karakteri yanlış yazacağını tahmin ediyoruz. Ve sonunda "m"den "g"ye kadar, boşluklar dahil 1-6 karakteri yanlış yazarlar.

Tüm bunları eklemek, markalı bir sorgunun birçok varyasyonunu kapsamlı bir şekilde yakalamanıza olanak tanır.

Unutulmaması gereken diğer bir nokta ise, marka adının sorgunun farklı bölümlerinde görünebilmesidir.

Bu yüzden marka adının kendisinin yakalandığından emin olmamız gerekiyor. Ya olmalıdır:

  • Sorgunun başında.
  • Sorgunun ortasında (dolayısıyla boşluklarla çevrili).
  • Veya sorgunun sonunda.

Bunun için normal ifade aşağıdaki gibidir:

  • (^|\s)(s+|a|d|z)[az\s]{1,4}m?[az\s]{1,6}(m|u|n|g|t|h|b|v)(\s|$)

Bu, "samsung" marka adının başında, ortasında veya sonunda olduğu tüm sorguları yakalar.

  • Dizinin başlangıcı = ^
  • Boşluklarla çevrili = \s
  • Dize sonu = $

JC Chouinard'ın Google Arama Konsolu'ndaki Normal İfadeler (RegEx) gönderisi, normal ifade örneklerinin daha da derinlerine iniyor.

Regex ve GSC API iş başında

Düzenli ifadeler, bir çekirdek güncellemenin ardından trafik düşüşleriyle karşılaşan bir istemciyle çalışırken Wu ve ekibi için yararlı oldu.

E-ticaret sitesinin farklı sorunlarına baktıktan sonra, sorunun bazı ürün detay sayfalarında bulunduğunu keşfettiler.

GSC'de analiz için sayfa türlerini segmentlere ayırmaları gerekiyordu. Ancak bu, ABD ve uluslararası ürünler için farklı URL yapıları nedeniyle karmaşık bir görevdi.

Sitenin uluslararası ürün URL'leri dil ve ülke kodlarını içerirken ABD ürün URL'leri içermiyordu.

Ürün bilgisi, kategoriler ve alt kategorilerde harfler ve tireler bulunduğundan, normal ifade sözdizimini kullanmak bile zordu. Ayrıca, yalnızca ABD sayfalarını yakalamak için uluslararası ürün URL'lerini filtrelemeleri gerekiyordu.

Tüm ABD ürün açılış + ayrıntı sayfalarını (i18n sayfaları değil ) almak için aşağıdaki normal ifade dizelerini buldular:

Dahil et: /([^/]+/){1,2}p?

Hariç tut: /[a-zA-Z]{2}|[a-zA-Z]{2}-[a-zA-Z]{2}/

İşte bir döküm:

Ekip, kategoriyi, alt kategoriyi ve tüm ürünleri eşleştirmek istedi, böylece şunları eklediler:

  • Eğik çizgi olmayan herhangi bir karakter = [^/]+
  • 1 veya 2 dizin = /){1,2}
  • Bazen bir ürün sümüklü böcek tarafından takip edilir = p?

Bir şapka ( ^ ) tipik olarak dizenin başlangıcı anlamına gelir. Ancak parantez içinde olduğunda ( [^/] 'da olduğu gibi), bir olumsuzlamayı belirtir (yani, “bu kutunun içindeki hiçbir şey değil”).

Yani bu dizi /([^/]+/){1,2}p? "eğik çizgi olmayan, eğik çizgiye (dizini belirtir) giden ve bazen 'p' harfinin (ürün sümüklü böceklerinin ön eki) ardından gelen herhangi bir sayıda karakter istiyorum" anlamına gelir.

Aynı zamanda, takım harfler ve tireler içeren ülke ve dil kombinasyonunu eşleştirmek istemedi, bu nedenle şunları hariç tuttular:

  • Herhangi bir 2 harfli dizin = [a-zA-Z]{2}
  • 2 harf + 2 harf dil-ülke birleşimi = [a-zA-Z]{2}-[a-zA-Z]{2}

Tüm dil ve ülke kodlarını tek başına eşleştirmek için düzenli bir ifade oluşturmak, olası tüm kombinasyonlar nedeniyle sıkıcı olurdu, bu nedenle buna bilgi sorguları için (her bir kombinasyon türünün hariç tutulduğu) olduğu gibi yaklaşamadılar.

Ancak bu normal ifade dizelerini oluşturduktan sonra bile bir sorunları vardı.

Google Arama Konsolunda, normal ifade dizesini yapıştırmak için yalnızca bir alan vardır. Normal ifadeyle eşleşir veya Normal ifadeyle eşleşmez'i seçmeniz gerekir; ikisini aynı anda kullanamazsınız.

GSC API, regex dizelerinin birleştirilmesine izin verdiği için burada kullanışlı oldu.

Google Arama Konsolu API belgelerinde Şimdi deneyin bağlantısı vardır.  

Bir kez tıklandığında, bir site seçmenize ve web görünümü aracılığıyla API isteğinizi yapmanıza olanak tanıyan bir konsol açılacaktır.

Ancak, API sorgularını daha iyi yönetmek için Wu, Postman'ı masaüstünde veya Paw'ı (Mac'e özgüdür) kullanmanızı önerir.

Postacı, sorgular oluşturmanıza ve bunları daha sonra kullanmak üzere kaydetmenize olanak tanır. Diğer sitelere erişiminiz varsa, her seferinde yeni bir sorgu oluşturmanız gerekmez. Sadece site adını bir değişkenle değiştirin ve ardından birden çok istekte bulunun.

Öte yandan pençe, bakmak ve kullanmak çok daha kolaydır.

API'ye erişmek için API anahtarlarınızı almanız gerekir. (İşte Chouinard'dan faydalı bir eğitim.)

Bu bilgiyi aldıktan sonra, Postacı veya Paw içinde OAuth 2.0 kimlik doğrulamanıza ekleyeceğiniz müşteri kimliğiniz ve müşteri sırlarınız olacaktır.

Oradan, normal hesabınızla oturum açabileceksiniz.

Wu, esas olarak Paw'daki regex dizelerini kullanarak GSC API istekleri yaptı. Sorgu, arayüzün ortasına girilir.

Google'dan gelen yanıt, GSC API web görünümüne benzer. Veriler daha sonra işlenmek üzere dışa aktarılabilir.

Veriler JSON'da olduğundan, bilgiler dağınık ve okunması zor olabilir.

Bunun için, bilgileri güzel bir şekilde yazdırmak için JQ adlı ücretsiz ve açık kaynaklı bir komut satırı JSON işlemcisi kullanabilirsiniz.

Veriler, bir elektronik tabloya girene kadar o kadar kullanışlı değildir. Paw'dan JQ'ya aktardığınız dosyaya aktarın. Açın ve ardından her satırı yineleyin - her bir öğeyi kaydederek bunları bir CSV'ye aktarabilirsiniz.

Burada, kayan (ondalık basamaklı bir sayı) tıklamaları ve gösterimleri dönüştürmeniz gerekir. Her ikisinin de bir CSV ile uyumlu dizelere dönüştürülmesi gerekir.

JQ daha sonra aşağıdaki çok daha basit formatı çıkaracaktır.

Ardından, bu biçimi almak için Dasel'i kullanacak ve ardından bir CSV'ye dönüştüreceksiniz.

Ve işte sonuç.

Wu'nun ekibi için şaşırtıcı olan şey, Google Arama Konsolu API'sini ve normal ifadeleri şu amaçlarla kullanabilmeleriydi:

  • Tüm uluslararası sorguları filtreleyin ve yalnızca ana sorunları yaşadıkları ABD'ye bakın.
  • Sitenin sorun yaşadığı günleri belirleyin.

İzleyin: Google Search Console API'sinden en iyi şekilde yararlanma

Wu'nun SMX Advanced sunumunun tam videosu aşağıdadır.