Jak przetwarzanie języka naturalnego zmienia sposób wyszukiwania

Opublikowany: 2020-05-14

Google stara się zwiększać trafność list prezentowanych na stronach wyników wyszukiwania (SERP) przy każdej aktualizacji algorytmu. Najnowszą aktualizacją SERP jest dwukierunkowa reprezentacja kodera Google z transformatorów (BERT), która wykorzystuje przetwarzanie języka naturalnego. BERT jest uznawany za jedną z najważniejszych zmian wprowadzonych przez Google w ciągu ostatnich pięciu lat — mającą bezpośredni wpływ na jedno na 10 zapytań.

Ma na celu wyświetlanie trafniejszych wyników poprzez poprawną interpretację złożonych, długich zapytań wyszukiwania. W tym poście omówimy, co to oznacza i jak zmienia sposób wyszukiwania.

Co to jest BERT?

Jest to oparta na sieci neuronowej technika wstępnego szkolenia NLP, która umożliwia Google dokładniejszą identyfikację kontekstu słów w danym zapytaniu.

Weźmy na przykład pod uwagę wyrażenia „sześć do 10” i „za kwadrans szósta”, ten sam przyimek „do” ma inne znaczenie w każdym wyrażeniu, co może nie być oczywiste dla wyszukiwarek. Jednak tutaj BERT staje się przydatny, ponieważ może skutecznie rozróżnić kontekst przyimka w pierwszym zdaniu w porównaniu z tym, jak jest on używany w drugim zdaniu. Dzięki zrozumieniu kontekstu może zapewnić bardziej trafne wyniki.

Sieci neuronowe algorytmów ułatwiają rozpoznawanie wzorców, podczas gdy sieci neuronowe trenowane na zbiorach danych mogą identyfikować wzorce. Jego typowe zastosowania obejmują treści graficzne, przewidywanie trendów na rynkach finansowych, a nawet rozpoznawanie pisma ręcznego. Podczas gdy przetwarzanie języka naturalnego lub NLP to ułamek sztucznej inteligencji (AI), który zajmuje się językoznawstwem.

  • NLP umożliwia komputerom zrozumienie, w jaki sposób ludzie naturalnie się komunikują.
  • Algorytmy NLP umożliwiają interpretację, zrozumienie i rozpoznawanie wzorców językowych.
  • Modele NLP podkreślają gramatykę i słowa, aby znaleźć znaczenie w nieskończonych ilościach tekstu i mowy.

Postępy ułatwione przez NLP, z których użytkownicy Internetu i firmy internetowe korzystają na co dzień, obejmują narzędzia do słuchania społecznościowego, sugestie słów i chatboty.

Co to znaczy?

BERT to algorytm NLP, który wykorzystuje sieci neuronowe do tworzenia wstępnie wytrenowanych modeli. Modele te są trenowane przy użyciu nieskończonych ilości danych dostępnych w Internecie. Wstępnie wytrenowane modele to ogólne modele NLP, które są dalej udoskonalane w celu wykonywania określonych zadań NLP. W listopadzie zeszłego roku Google udostępnił BERT jako open source, twierdząc, że dostarczył kompletnych i odpowiednich wyników w 11 zadaniach NLP, w tym w zbiorze danych dotyczących odpowiedzi na pytania ze Stanforda.

Dwukierunkowość BERT odróżnia go od innych algorytmów, ponieważ umożliwia mu nadanie kontekstu słowu. Może to zrobić, nie tylko biorąc pod uwagę części zdania prowadzące do tego słowa, ale także biorąc pod uwagę części następujące po nim. Dwukierunkowość pozwala wyszukiwarkom zrozumieć znaczenie słowa, takiego jak „film”, które ma inne znaczenie, gdy jest używane w „filmie okiennym”, w przeciwieństwie do słowa „przebój”.

W wyszukiwaniu BERT ułatwia zrozumienie kluczowych szczegółów zapytania, zwłaszcza w przypadku złożonych zapytań konwersacyjnych lub zawierających przyimki. Na przykład w zapytaniu „Indyjski podróżnik na Bali w 2021 r. potrzebuje wizy” przyimek „do” sugeruje, że podróżny jedzie z Indii na Bali. Zmieniając przyimek, możesz całkowicie zmienić zdanie, które brzmiałoby: „Indyjski podróżnik z Bali w 2021 r. potrzebuje wizy” i może oznaczać, że podróżni są z Bali i potrzebują wizy do Indii. BERT pozwala na zrozumienie różnicy kontekstowej między dwoma zdaniami.

Jaka jest różnica między BERT a RankBrain?

RankBrain była pierwszą metodą sztucznej inteligencji Google zastosowaną w wyszukiwaniu. Działa równolegle z algorytmami rankingu organicznych wyszukiwań i dostosowuje wyniki obliczane przez te algorytmy. RankBrain dostosowuje wyniki oferowane przez algorytmy na podstawie historycznych zapytań.

RankBrain ułatwia również Google interpretację wyszukiwanych haseł, dzięki czemu może wyświetlać wyniki, które mogą nie zawierać dokładnie takich słów, jak zapytanie. Na przykład, szukając „wysokości punktu orientacyjnego w Dubaju”, „automatycznie wyświetli informacje związane z Burdż Chalifa.

Z drugiej strony dwukierunkowy komponent BERT sprawia, że ​​działa on w zupełnie inny sposób. Tam, gdzie tradycyjne algorytmy sprawdzają zawartość strony, aby ocenić trafność, algorytmy NLP idą o krok dalej, patrząc na treść przed lub po słowie w celu uzyskania dodatkowego kontekstu. Ponieważ komunikacja międzyludzka jest zwykle złożona i wielowarstwowa, postęp w przetwarzaniu języka naturalnego jest niezbędny.

BERT i RankBrain są wspólnie wykorzystywane przez Google do przetwarzania i rozumienia zapytań. BERT nie zastępuje RankBrain, ale może być stosowany razem z innymi algorytmami Google lub w połączeniu z RankBrain, w zależności od wyszukiwanego hasła.

Ulepszanie wyszukiwania w większej liczbie języków

Dzięki możliwości zastosowania tego, czego nauczyliśmy się w jednym języku, w innym, BERT jest wykorzystywany do zwiększania trafności wyników wyszukiwania dla internautów na całym świecie. Na przykład to, czego nauczyliśmy się z najczęściej używanych języków w sieci, takich jak angielski, jest następnie stosowane w innych językach. W ten sposób oferuje lepsze wyniki w innych językach, w których ludzie wyszukują. Co więcej, model BERT zwiększa również trafność fragmentów polecanych w różnych krajach i językach.

Jak BERT wpływa na Twoją firmę?

BERT wpływa również na Asystenta Google, uruchamiając go do oferowania polecanych fragmentów lub wyników internetowych, na które ma wpływ aktualizacja BERT. Technologia NLP, taka jak BERT, poprawia zrozumienie maszyn, a ta innowacja jest niewątpliwie korzystna dla wielu użytkowników online i firm. Jednak w odniesieniu do SEO zasady pozostają te same. Jeśli masz najlepsze praktyki SEO zakorzenione w swojej strategii marketingowej, możesz być pewny sukcesu w sieci. Witryny, które stale generują wysokiej jakości, trafne i świeże treści, odniosą największe korzyści z tej aktualizacji algorytmu.

Pisanie najwyższej jakości treści w oparciu o badania słów kluczowych to ćwiczenie, które pozostanie priorytetowym czynnikiem rankingowym we wszystkich wyszukiwarkach. Właściciele stron internetowych, którzy koncentrują się na tym, aby ich użytkownicy otrzymywali informacje i dokładne treści, jakich oczekują, uzyskują dobre pozycje w SERP. Monitorowanie wydajności stron podczas tworzenia świetnych treści pomoże witrynom zachować trafność.

Czy NLP rozwiązuje zamiary wyszukiwania?

Dzięki BERT, niezależnie od języka lub słów użytych w zapytaniu, szanse na uzyskanie przez Google poprawnych wyników są wyższe, ale nadal nie wynoszą 100 procent. Na przykład, nawet z BERT, każdy, kto szuka „jaki stan jest na południe od Nebraski”, prawdopodobnie uzyska wyniki dla „Południowa Nebraska” zamiast dla Kansas, co jest prawdopodobnie odpowiedzią, której szuka użytkownik.

Pomaganie maszynom w zrozumieniu języka pozostaje ciągłym przedsięwzięciem, a uzyskiwanie określonego znaczenia z dowolnego zapytania jest złożonym procesem. Gdy Google stosuje NLP do listy kluczowych słów kluczowych, wyświetlane najlepsze wyniki mogą nie zawierać niektórych lub nawet tylko jednego z wymaganych słów kluczowych, przez co te wyniki są nieistotne. Dzięki BERT Google poprawił swoją grę, oferując wyrafinowaną aktualizację swojego algorytmu, ale wyszukiwanie pozostaje nierozwiązanym problemem ze względu na złożoną naturę ludzkiego języka.