Cómo el procesamiento del lenguaje natural cambia la forma en que realiza búsquedas

Publicado: 2020-05-14

Google se esfuerza por mejorar la relevancia de los listados presentados en las páginas de resultados del motor de búsqueda (SERP) con cada actualización del algoritmo. Una actualización reciente de las SERP son las Representaciones de codificador bidireccional de Transformers (BERT) de Google, que utiliza procesamiento de lenguaje natural. BERT se considera uno de los cambios más importantes introducidos por Google en los últimos cinco años, que afecta directamente a una de cada 10 consultas de búsqueda.

Su objetivo es mostrar resultados más relevantes mediante la interpretación correcta de consultas de búsqueda complejas y de cola larga. En esta publicación, discutiremos qué significa esto y cómo cambia la forma en que buscas.

¿Qué es BERT?

Es una técnica basada en redes neuronales para el entrenamiento previo de PNL que permite a Google identificar el contexto de las palabras en una consulta de búsqueda determinada con mayor precisión.

Por ejemplo, considere las frases "seis a 10" y "un cuarto para las seis", la misma preposición "a" tiene un significado diferente en cada frase, lo que puede no ser obvio para los motores de búsqueda. Sin embargo, aquí es donde BERT se vuelve útil, ya que puede hacer una distinción efectiva entre el contexto de la preposición en la primera frase en comparación con cómo se usa en la segunda frase. A través de la comprensión del contexto, puede proporcionar resultados más relevantes.

Las redes neuronales de algoritmos facilitan el reconocimiento de patrones, mientras que las redes neuronales entrenadas en conjuntos de datos pueden identificar patrones. Sus aplicaciones típicas incluyen contenido de imágenes, predicción de tendencias del mercado financiero e incluso reconocimiento de escritura a mano. Mientras que el procesamiento del lenguaje natural o PNL es una fracción de la inteligencia artificial (IA) que se ocupa de la lingüística.

  • La PNL permite que las computadoras entiendan cómo los humanos se comunican naturalmente.
  • Los algoritmos de PNL permiten la interpretación, la comprensión y el reconocimiento de patrones de lenguaje.
  • Los modelos de PNL resaltan la gramática y las palabras para encontrar significado en cantidades infinitas de texto y habla.

Los avances facilitados por la PNL que los usuarios de Internet y las empresas en línea utilizan todos los días incluyen herramientas de escucha social, sugerencias de palabras y chatbots.

¿Qué quiere decir esto?

BERT es un algoritmo NLP que utiliza redes neuronales para producir modelos previamente entrenados. Estos modelos se entrenan utilizando cantidades infinitas de datos disponibles en la web. Los modelos preentrenados son modelos genéricos de PNL que se perfeccionan aún más para realizar tareas específicas de PNL. En noviembre del año pasado, Google abrió BERT, afirmando que proporcionó resultados completos y relevantes en 11 tareas de PNL, incluido el conjunto de datos de respuesta a preguntas de Stanford.

La bidireccionalidad de BERT lo distingue de otros algoritmos, ya que le permite dar contexto a una palabra. Puede hacerlo no solo considerando partes de la oración que conducen a esa palabra, sino también teniendo en cuenta las partes que la siguen. La bidireccionalidad permite que los motores de búsqueda entiendan el significado de una palabra como "película" que tiene un significado diferente cuando se usa en "película de ventana" en comparación con cuando se usa junto con "éxito de taquilla".

En la búsqueda, BERT facilita la comprensión de los detalles clave de una consulta, especialmente cuando se trata de consultas complejas, conversacionales o con preposiciones. Por ejemplo, en la consulta "El viajero indio de 2021 a Bali necesita una visa", la preposición "a" sugiere que el viajero va de la India a Bali. Al cambiar la preposición, podría cambiar la oración por completo, que diría "El viajero indio de 2021 de Bali necesita una visa", y podría significar que los viajeros son de Bali y necesitan una visa para la India. BERT permite la comprensión de la diferencia contextual entre las dos oraciones.

¿Cuál es la diferencia entre BERT y RankBrain?

RankBrain fue el primer método de inteligencia artificial de Google aplicado en la búsqueda. Se ejecuta en paralelo a los algoritmos de clasificación de búsqueda orgánica y realiza ajustes a los resultados calculados por esos algoritmos. RankBrain ajusta los resultados ofrecidos por los algoritmos en base a consultas históricas.

RankBrain también facilita que Google interprete las consultas de búsqueda para que pueda mostrar resultados que pueden no tener las palabras exactas de la consulta. Por ejemplo, al buscar "la altura del punto de referencia en Dubai", automáticamente le mostrará información relacionada con Burj Khalifa.

Por otro lado, el componente bidireccional de BERT hace que funcione de manera muy diferente. Mientras que los algoritmos tradicionales observan el contenido de la página para medir la relevancia, los algoritmos de NLP van un paso más allá al observar el contenido antes o después de una palabra para obtener contexto adicional. Dado que la comunicación humana suele ser compleja y en capas, hace que este avance en el procesamiento del lenguaje natural sea esencial.

Google utiliza BERT y RankBrain juntos para procesar y comprender las consultas. BERT no sustituye a RankBrain, pero se puede aplicar junto con otros algoritmos de Google o en combinación con RankBrain, según el término de búsqueda.

Mejorar la búsqueda en más idiomas

Con la capacidad de tomar lo que hemos aprendido de un idioma y aplicarlo a otro, BERT se utiliza para hacer que los resultados de búsqueda sean más relevantes para los usuarios de Internet en todo el mundo. Por ejemplo, lo que aprendimos de los idiomas más utilizados en la web, como el inglés, se aplica luego a otros idiomas. Por lo tanto, ofrece resultados mejorados en otros idiomas en los que las personas también buscan. Además, el modelo BERT también mejora la relevancia de los fragmentos destacados en todos los países e idiomas.

¿Cómo afecta BERT a su negocio?

BERT también afecta al Asistente de Google al activarlo para que ofrezca fragmentos destacados o resultados web influenciados por la actualización de BERT. La tecnología NLP como BERT mejora la comprensión de la máquina y esta innovación es, sin duda, beneficiosa para muchos usuarios y empresas en línea. Sin embargo, en lo que respecta al SEO, los principios siguen siendo los mismos. Si tiene las mejores prácticas de SEO arraigadas en su estrategia de marketing, entonces puede estar seguro de su éxito web. Los sitios web que producen contenido fresco, relevante y de alta calidad de manera constante se beneficiarán al máximo de esta actualización del algoritmo.

Escribir contenido superior basado en la investigación de palabras clave es un ejercicio que seguirá siendo un factor de clasificación prioritario en los motores de búsqueda. Los propietarios de sitios web que se enfocan en que sus usuarios obtengan el contenido informativo y preciso que esperan, terminan con una buena clasificación en el SERP. Supervisar el rendimiento de las páginas, mientras se crea un gran contenido, ayudará a que los sitios web sigan siendo relevantes.

¿La PNL resuelve la intención de búsqueda?

Con BERT, independientemente del idioma o las palabras utilizadas en la consulta, las posibilidades de que Google obtenga los resultados correctos han aumentado, pero aún no son del 100 por ciento. Por ejemplo, incluso con BERT, cualquiera que busque "qué estado está al sur de Nebraska", es probable que obtenga resultados para "Nebraska del Sur" en lugar de Kansas, que es probablemente la respuesta que busca el usuario.

Ayudar a las máquinas a comprender el lenguaje sigue siendo un esfuerzo continuo y derivar un significado definitivo de cualquier consulta dada es un proceso complejo. Cuando Google aplica NLP a una lista de palabras clave clave, es posible que los principales resultados que se muestren no contengan algunas o incluso solo una de las palabras clave requeridas, lo que hace que esos resultados sean irrelevantes. Con BERT, Google ha mejorado su juego al ofrecer una actualización sofisticada de su algoritmo, pero la búsqueda sigue siendo un problema sin resolver debido a la naturaleza compleja del lenguaje humano.