Guía práctica para un diseño de interfaz de usuario de voz impecable
Publicado: 2020-02-10Desde que vi la primera parte de Iron Man, me ha fascinado el potencial de la tecnología de inteligencia artificial Tony, muy bien con su asistente de inteligencia artificial Jarvis.
¡Pero hey! Ya estamos a mitad de camino no en el carrete sino en la vida real.
¿Recuerdas haber usado Siri por primera vez en el iPhone 4S? Era una sensación de otro mundo, ¿no? Y desde entonces, todos sabemos lo lejos que hemos llegado: Alexa , Google Assistant , Cortona y cien más.
Entonces, como diseñador inspirado, si está tan fascinado como yo y quiere darle una oportunidad a la IA basada en voz, entonces necesita perfeccionar sus habilidades y conocimientos sobre cómo diseñar interfaces de usuario de voz .
Por suerte, te has topado con el artículo correcto. Aquí encontrará todo lo que desea y necesita saber sobre las VUI y lo que las convierte en una parte importante del diseño intuitivo de búsqueda de aplicaciones.
¿Qué es VUI (interfaz de usuario de voz)?
Acrónimo de Voice user Interface, VUI es la interfaz que permite a los usuarios interactuar con un sistema a través de comandos de voz. Los ejemplos de interfaz de usuario de voz más populares y principales son el Asistente de Google, Siri y Alexa de Amazon.
La mayor ventaja de las VUI es que facilitan una forma de interactuar con un sistema sin ojos ni manos.
Al igual que las aplicaciones móviles que se ejecutan en cualquier sistema operativo y dispositivo, la VUI contiene tres capas que deben trabajar juntas para interacciones de voz eficientes. Aquí, cada una de las tres capas usa la capa que está debajo mientras soporta la que está arriba. Son las dos capas superiores en las que se encuentra la interfaz de voz, que reside en la nube y no en el dispositivo.
Pasos para diseñar la interfaz de usuario de voz
1. Investiga a tu audiencia
En este proceso de diseño de VUI, debe emplear el diseño centrado en el usuario tal como lo haría al diseñar otros productos digitales. El objetivo principal aquí es recopilar información y comprender el comportamiento y las necesidades de los usuarios, ya que esta información es la base de los requisitos del producto.
En lo que debe concentrarse en esta etapa es:
- Identificar los puntos débiles de los usuarios y cómo es su experiencia. Al hacerlo, podrá analizar dónde se pueden beneficiar los usuarios.
- Debe recopilar información sobre el idioma del usuario: cómo hablan y las frases que usan mientras hablan. Esto le ayudará a diseñar un sistema para diferentes expresiones.
2 . Definir
En esta etapa, debe definir las capacidades y dar forma al producto. Esto incluye -
- Crear escenarios clave de interacción
Estos escenarios preceden a las ideas específicas de la aplicación y deben identificarse para convertirse en un flujo de diálogo conversacional. Son una forma de pensar por qué alguien necesitaría usar una VUI. Por lo tanto, debe diseñar escenarios que tengan un alto valor para sus usuarios.
A veces, puede resultar confuso qué escenarios son importantes y cuáles se pueden ignorar. Para ello, puede utilizar una matriz de casos de uso para evaluar cada uno de ellos.
- Asegúrese de que estos escenarios funcionen con voz
Lo que más importa aquí es que los usuarios puedan resolver un problema específico de manera más eficiente de lo que podrían hacerlo con las alternativas. El objetivo de este paso es encontrar los casos comunes y específicos de los que se beneficiarán los usuarios.
Entre muchos, algunos casos son: A. cuando los usuarios están preocupados y no pueden usar la interfaz de usuario visual, y B. cuando quieren hacer algo rápidamente. Es decir, ordenar a la VUI que “ Reproduzca algo de música ” lleva mucho menos tiempo que hacerlo manualmente.
- Los tres factores: Intención, Expresión, Espacio
Entendamos estos dos con el ejemplo mencionado anteriormente de " Reproducir algo de música ".
Intención: básicamente representa el objetivo más amplio del comando de voz. Hay dos tipos de intenciones: A. Alta utilidad (comando muy específico y directo, es decir, 'enciende las luces de la sala de estar) y B. Baja utilidad (más vaga y difícil de descifrar). En nuestro caso, es una interacción de alta utilidad.
Enunciado: se ocupa de las posibles formas en que los usuarios pueden formular una solicitud. En nuestro caso, la alternativa a " Reproducir algo de música " podría ser cualquier cosa, desde " Quiero escuchar algo de música " hasta " ¿Puedes tocar una canción ?", etc. Todos los diseñadores de UI/UX de VUI deben tener en cuenta las variaciones.
Tragamonedas: cuando la intención no es suficiente, las tragamonedas entran en acción. Hacen referencia a la información adicional necesaria para ofrecer los mejores resultados para la consulta. Pueden ser opcionales y obligatorios. En nuestro ejemplo, la ranura es 'relajante' pero es opcional ya que el usuario no define la categoría de música. Sin embargo, si el comando fuera ' reservar un taxi en Uber ', el espacio sería 'destino', por lo tanto, obligatorio.
3. Crea un prototipo
El flujo de diálogo es la respuesta a la pregunta de “cómo crear una interacción de voz entre el usuario y la tecnología” . El proceso comienza con la creación de un flujo de diálogo para cada requisito al que pretende llegar con su producto.
Estos son los siguientes puntos que debe cubrir un flujo de diálogo: palabras clave principales para la interacción, ramas probables hacia las que podría dirigirse la conversación y diálogos de ejemplo para usuarios y asistentes.
Un flujo de diálogo en nuestro caso no es más que un prototipo que ilustra las conversaciones de ida y vuelta entre los usuarios y los asistentes de voz. Veamos un flujo de diálogo ilustrado a continuación para una mejor comprensión.
Puede utilizar varias herramientas de creación de prototipos a su disposición para VUI. Algunos de los más populares son Amazon Alexa Skill Builder, Sayspring y el SDK de Google.
escribir diálogos
Un conjunto compilado de diálogos es lo que hace que los componentes básicos del usuario de voz fluyan. Aquí hay algunos consejos para crear un diálogo atractivo y conversacional:
- No hagas el proceso tediosamente largo. Mantenga el número de pasos al mínimo.
- No debe enseñar comandos a los usuarios. Esto es algo que es natural. En su lugar, concéntrese en hacer que su asistente de voz sea conversacional.
- Trate de mantener sus preguntas y respuestas breves. Aquí están los pros y contras.
no -
Usuario: “Dime un buen lugar para comer comida china”
Sistema: “He encontrado cinco lugares para ti. El primero es “Eat Chinese” está ubicado…, a 15 minutos de ti, abierto de 8:00 am a 8:00 pm, el segundo es “Chopsticks” que está ubicado en…, a 1 hora de ti,…”
Hacer -
Usuario: “Dime un buen lugar para comer comida china”
Sistema: "Hay varios restaurantes chinos en la zona. ¿Preferirías caminar o conducir?"
Identificar errores
¿No es mejor identificar los errores probables que puedes cometer al crear diálogos que arreglar el lío magnificado más tarde? Aquí hay algunas cosas de las que definitivamente debe mantenerse alejado, pero siempre manténgalas en perspectiva para evitar estados de error.
- Ambigüedad : las palabras son inherentemente ambiguas. Es decir, si una persona dice "Bien" , podría significar "Está bien" o simbolizar que está escuchando. Por lo tanto, haga que su IA sea consciente de todas las ambigüedades que ocurren comúnmente para un rendimiento óptimo.
- Errores ortográficos/pronunciación incorrecta : a diferencia del papel, las palabras se pronuncian de manera diferente. Una sola palabra podría tener múltiples pronunciaciones, lo que podría dificultar el flujo de conversación entre el usuario y el sistema de procesamiento de lenguaje natural.
- No proporcionar opciones relevantes : siempre asegúrese de que los usuarios obtengan algo valioso y relevante de la conversación. Los resultados irrelevantes para una consulta son menos atractivos e incluso menos motivadores para que los usuarios vuelvan a utilizar su producto.
Incluso si la consulta no tiene un resultado positivo, su asistente siempre debe responder y no dejar a los usuarios colgados. Es decir, si un usuario solicita " Reservar un vuelo a Los Ángeles desde Dallas para el martes ", lo que debería seguir es: " No pude encontrar ningún vuelo para el martes ". Y lo que es aún mejor: “ No pude encontrar ningún vuelo para el martes. ¿Quieres que te confirme para el miércoles? ”.
Retrata la identidad de tu marca
Incluso en las conversaciones humanas, el tono de la voz es muy importante ya que tiene un valor emocional asociado. Entonces, sus diálogos son lo que se convertirá en la personalidad de su producto y siempre debe causar una impresión positiva en la mente de los usuarios. Necesitas crear no solo 'diálogos' sino aquellos que satisfagan las necesidades emocionales de los usuarios.
Usar contenido existente
Si utiliza los datos que tiene a su disposición (todas las conversaciones que su producto tiene con el usuario), puede personalizar mucho su experiencia. Por ejemplo, si un usuario ordena “ Quiero pedir fideos ”, su sistema debería revertir “ ¿Le gustaría repetir su último pedido de fideos Hakka de Chopstick? ”
4. Prueba tu producto
Después de que todo haya llegado a una etapa cercana a su finalización, es hora de probar las semillas de su trabajo. Debe probar la VUI que ha diseñado para asegurarse de que cumpla con todos los puntos de referencia de su lista de verificación. Hay dos formas que puede usar para probar su prototipo.
- Con usuarios objetivo
Puede crear grupos de su público objetivo y luego implementar sesiones de prueba para observar cómo los usuarios interactúan con su producto. Puede aprovechar esta ocasión para realizar un seguimiento de la tasa de finalización de tareas y la puntuación de satisfacción del cliente (CSAT).
- Con simuladores de prueba
Al igual que otros simuladores utilizados en el desarrollo de aplicaciones móviles, Google y Amazon también brindan herramientas para probar el producto diseñado. Puede probar Alexa Skill y Google Action del producto con respecto a los dispositivos de hardware y su configuración.
5. Refinar
Después de que su aplicación haya aterrizado en el mercado, es hora de observar. Es hora de disfrutar del análisis de UX. Esta etapa se ocupa de analizar cómo los usuarios están utilizando su producto. Puede ser un gran desafío si no tiene idea de qué métricas se supone que debe observar. Entonces, aquí están los más destacados.
- Sesiones por usuario o mensajes por sesión
- Idiomas utilizados
- Intenciones y declaraciones
- Métricas de participación del usuario
- Flujos de comportamiento
Pautas de diseño para la interfaz de usuario de voz
“Las palabras son fuente de malentendidos” – Antoine de Saint-Exupery
Normalmente, las interfaces de usuario visuales también tienen problemas que deben abordarse, pero la frustración de una interfaz visual defectuosa no es nada comparada con la de una VUI. Entonces, si su asistente de voz diseñado no funciona bien, sería desechado como una papa caliente.
(También puede leer nuestro artículo sobre Visual Storytelling for App UI/UX Design )
¿Sabes qué te ayudará a evitar que eso suceda? – Directrices de diseño de VUI . Entonces, echemos un vistazo a ellos a la vez.
No espere a que los usuarios pregunten primero
A diferencia de una interfaz de usuario visual, es posible que los usuarios no puedan familiarizarse con las funcionalidades de inmediato. Es posible que ni siquiera sepan cómo empezar. En ese caso, una de las mejores prácticas de Voice UI es dar el primer paso. Por ejemplo, si la suya es una aplicación meteorológica móvil habilitada por voz , podría decirles a los usuarios: “ Pueden solicitar el clima de hoy o un pronóstico semanal. Además, también debe ofrecer una opción de salida fácil.
Mantenga corta la lista de opciones de acción
Hasta que ya menos que desee abrumar a su usuario desde el principio, debe asegurarse de proporcionar principalmente las opciones más adecuadas y básicas.
El contenido verbal tiene que ser lo más conciso y lleno de significado posible y, al mismo tiempo, fácil de entender de una sola vez. Según lo recomendado por Amazon para diseñar interfaces de usuario de voz para aplicaciones móviles para Alexa, no se deben enumerar más de tres opciones para la interacción. Hacer esto también garantizará un diseño UX atractivo de la VUI.
KISS – Mantenlo simple y corto
Este principio es muy útil en el diseño de VUI. Para que el desarrollo de su aplicación de voz sea el mejor que existe, debe facilitar que su asistente de voz entienda los comandos. Supongamos que está diseñando una interacción de voz para iniciar una máquina de taller, la forma más sencilla sería atribuir números a estas múltiples máquinas y luego dar comandos como " Iniciar máquina 1 ", etc.
Permita que los usuarios sepan que están siendo escuchados
Recuerda lo agitado que te sientes cuando no hay ningún signo de actividad en una página web que acabas de abrir. Ahora, multiplique esta frustración en el caso de VUI.
Es muy importante mantener en perspectiva que su usuario necesita estar informado cuando el dispositivo está interactuando activamente. Debe dar colas a los usuarios sobre cuándo hablar y cuándo el asistente de voz está escuchando. Una imagen de arriba del Asistente de Google muestra cómo representa esta función (con puntos que forman una onda) y con Alexa como se muestra a continuación (una luz azulada girando alrededor del borde superior del dispositivo).
Confirmar cuando la tarea esté lista
Al igual que necesita confirmación después de haber realizado cualquier transacción, se necesita lo mismo con una VUI. De lo contrario, ¿cómo sabría el usuario que se ha realizado la tarea?
Por ejemplo, una vez que el usuario da el comando “ apagar las luces de la cocina ”, tu asistente debe responder con algo como “Luces de la cocina apagadas” . Esto eliminará la necesidad de que el usuario verifique la tarea realizada en persona, que es esencialmente el objetivo de tener una IA basada en voz.
(Lectura adicional: Consejos y tendencias de diseño de interfaz de usuario de aplicaciones móviles a seguir en 2020 {Exclusive} )
Desafíos de diseñar VUI
Como todo lo demás, la interfaz basada en voz también sufre del talón de Aquiles . De hecho, no hay uno sino muchos. Entonces, ¿cuáles son los desafíos que los diseñadores de VUI a menudo encuentran y, en la mayoría de los casos, no logran reconocer o resolver?
Privacidad y seguridad
El hecho de que estos asistentes de IA basados en voz estén siempre esperando colas escuchando los sonidos de su entorno supone una gran preocupación para los usuarios. La paranoia de que su privacidad sea manipulada tampoco es irracional.
Inicialmente, los asistentes de voz como Alexa almacenaban todas las conversaciones con las que se encontraban, lo que representa un gran riesgo para la IA de voz a los ojos de los usuarios. Algo así como una pesadilla le sucedió a una pareja cuando atraparon a Alexa enviando sus grabaciones secretas a un extraño. Ahora, algunos asistentes eliminan automáticamente las conversaciones almacenadas cada 24 horas aproximadamente. Sin embargo, estos tienen un costo adicional y fricción en la interfaz de usuario.
Transmitir lo que los asistentes de voz no pueden realizar
Se vuelve un desafío para los diseñadores de UX y UI de voz explicar a los usuarios finales lo que Voice AI no puede hacer. Por ejemplo, mientras usa el Asistente de Google cuando dice " Haga un evento llamado Reunión del equipo de ventas para el martes a las 2 en punto ", crea una tarjeta de evento instantáneamente y luego pregunta " ¿Le gustaría guardar este evento?" ”
Pero, ¿qué pasa si necesita cambiar la ubicación o la hora de la reunión más tarde? ¿Entonces qué? Respondería “ No estoy seguro de lo que dijiste, ¿quieres que guarde este evento? ”. Para evitar la mala experiencia del usuario, la IA podría simplemente decir " lo siento, todavía estoy trabajando para agregar ubicaciones ".
Dificultad en la creación de prototipos y pruebas.
Otro desafío al que se enfrentan los diseñadores es la creación de prototipos y pruebas de interfaz de usuario de voz. Supongamos que ha creado un prototipo y desea probarlo. Ha dado el aviso inicial de que los usuarios pueden comprar comestibles con su asistente de voz.
El desafío comienza aquí: los usuarios pueden decir una cosa en particular en diferentes estilos, algo que es difícil de seguir. Se vuelve aún más difícil probar el prototipo en tales consultas cuando aún no está completamente desarrollado con la tecnología de búsqueda por voz .
Soporte de lenguaje
Dado que el principio principal de la tecnología de voz es el lenguaje, se vuelve crucial para cualquier IA basada en voz tener fluidez tanto en la comprensión como en el habla. Lamentablemente, la tecnología solo se ha desarrollado con respecto a unos pocos idiomas hasta el momento. Sin embargo, agregar otros idiomas y acentos distintivos a la interfaz aún es un trabajo en progreso.
Futuro de VUI
Como un ritual, estamos obligados a mirar las perspectivas futuras de cada tecnología y la voz no es diferente. Por lo que hemos recopilado de los casos de uso de la interfaz de voz como Alexa, sabemos que la integración de la tecnología de voz por sí sola no puede cumplir con los requisitos diarios de los usuarios.
La mejor manera de que se adopte por completo es estrechando la mano con la interfaz de usuario visual, al igual que el Asistente de Google y Siri. La VUI y la interfaz visual de usuario juntas pueden equilibrar las deficiencias de los demás, brindando a los usuarios una increíble experiencia de asistente de voz . Además, esto les permitirá realizar tareas complejas con comandos de voz simples, que es lo que les falta a las interfaces de voz en este punto de su desarrollo.
Y quién sabe, para cuando termine esta década, es posible que todos tengamos nuestro Jarvis y podamos hacerlo todo como Tony Stark sin una pantalla física.
Nota final
Las VUI están aquí para quedarse y se integrarán en más y más productos en el futuro. Esperamos que nuestro blog haya sido útil para despejar todas sus dudas sobre el diseño de interfaces de usuario de voz. Pero, en caso de que aún tenga alguna consulta o desee obtener más información sobre VUI, puede conectarse con nuestro equipo y nuestros expertos con gusto lo ayudarán con soluciones innovadoras.