Guia de instruções para um design de interface de usuário de voz impecável

Publicados: 2020-02-10

Desde que vi a primeira parte do Homem de Ferro, fiquei fascinado com o potencial da tecnologia de IA Tony, muito bem com seu assistente de IA Jarvis.

Mas ei! Já estamos na metade do caminho, não no carretel, mas na vida real.

Lembra-se de usar a Siri pela primeira vez no iPhone 4S? Era uma sensação de outro mundo, não era? E desde então, todos sabemos até onde chegamos – Alexa , Google Assistant , Cortona e mais cem.

Portanto, como designer inspirado, se você está tão fascinado quanto eu e deseja dar uma chance à IA baseada em voz, precisa aprimorar suas habilidades e conhecimentos sobre como projetar interfaces de usuário de voz .

Felizmente, você encontrou o artigo certo. Aqui está tudo o que você gostaria e precisa saber sobre VUI e o que os torna uma parte importante do design intuitivo de pesquisa de aplicativos.

O que é VUI (interface de usuário de voz)?

Acrônimo de Voice user Interface, VUI é a interface que permite aos usuários interagir com um sistema por meio de comandos de voz. Os exemplos de interface de usuário de voz mais populares e principais são Google Assistant, Siri e Alexa da Amazon.

A maior vantagem das VUIs é que elas facilitam uma maneira de interagir com um sistema sem olhos e mãos.

Semelhante a aplicativos móveis executados em qualquer sistema operacional e dispositivo, a VUI contém três camadas que precisam trabalhar juntas para interações de voz eficientes. Aqui, cada uma das três camadas usa a camada que está abaixo dela enquanto suporta a camada acima. São as duas camadas superiores em que se encontra a interface de voz, residindo na nuvem e não no dispositivo.

interaction layers of VUI

Etapas para projetar a interface do usuário de voz

1. Pesquise seu público

Nesse processo de criação de VUI, você precisa empregar o design que prioriza o usuário da mesma forma que faria ao projetar outros produtos digitais. O objetivo principal aqui é coletar informações e entender o comportamento e as necessidades dos usuários, pois essas informações são o que constitui a base dos requisitos do produto.

O que você deve focar nesta fase é –

  • Identifique os pontos problemáticos dos usuários e como é a experiência deles. Ao fazer isso, você poderá analisar onde os usuários podem se beneficiar.
  • Você deve coletar informações sobre o idioma do usuário - como eles falam e as frases que usam enquanto falam. Isso o ajudará a projetar um sistema para diferentes enunciados.

2 . Definir

Nesta fase, você precisa definir os recursos e moldar o produto. Isso inclui -

  • Criando cenários-chave de interação

Esses cenários vêm antes das ideias específicas do aplicativo e devem ser identificados para serem transformados em fluxo de diálogo conversacional. Eles são uma maneira de pensar por que alguém precisaria usar uma VUI. Portanto, você precisa projetar os cenários com alto valor para seus usuários.

Às vezes, pode ser confuso saber quais cenários são importantes e quais podem ser ignorados. Para isso, você pode usar uma matriz de casos de uso para avaliar cada um deles.

matrix of Voice Interaction cases

  • Verifique se esses cenários funcionam com voz

O que mais importa aqui é que os usuários são capazes de resolver um problema específico com mais eficiência do que seriam capazes com as alternativas. O objetivo desta etapa é encontrar os casos comuns e específicos dos quais os usuários se beneficiarão.

Entre muitos, alguns casos são – A. quando os usuários estão preocupados e não podem usar a interface visual do usuário, e B. quando querem fazer algo rapidamente. Ou seja, comandar a VUI para “ Tocar música ” é muito menos demorado do que fazê-lo manualmente.

  • Os três fatores - Intenção, Enunciado, Slot

Vamos entender esses dois com o exemplo acima mencionado de “ Tocar alguma música ”.

Intenção – Representa basicamente o objetivo mais amplo do comando de voz. Existem dois tipos de intents – A. Alta utilidade (comando muito específico e direto, ou seja, 'acende as luzes da sala) e B. Baixa utilidade (vaga e difícil de decifrar). No nosso caso, é uma interação de alta utilidade.
Enunciado – Ele lida com as possíveis maneiras pelas quais os usuários podem formular uma solicitação. No nosso caso, a alternativa para “ Tocar uma música ” pode ser qualquer coisa de “ Quero ouvir uma música ” a “ Você pode tocar uma música ” e assim por diante. Todos os designers de UI/UX da VUI precisam levar em consideração as variações.

Slots – Quando a intenção não é suficiente, os slots entram em ação. Referem-se às informações adicionais necessárias para entregar os melhores resultados para a consulta. Eles podem ser opcionais e obrigatórios. Em nosso exemplo, o slot é 'relaxante', mas é opcional, pois a categoria da música não é definida pelo usuário. No entanto, se o comando fosse ' reservar um táxi no Uber ' o slot seria 'destino', portanto, obrigatório.

3. Crie um protótipo

O fluxo de diálogo é a resposta à questão de “como criar interação de voz entre usuário e tecnologia” . O processo começa com a criação de um fluxo de diálogo para cada requisito que você pretende atingir com seu produto.

Estes são os seguintes pontos que um fluxo de diálogo deve cobrir – Palavras-chave principais para a interação, prováveis ​​ramificações para onde a conversa pode se dirigir e exemplos de diálogos para usuários e assistentes.

Um fluxo de diálogo no nosso caso nada mais é do que um protótipo que ilustra as conversas entre usuários e assistentes de voz. Vejamos um fluxo de diálogo ilustrado abaixo para melhor compreensão.

voice interaction between user and technology flowchart

Você pode usar várias ferramentas de prototipagem à sua disposição para VUI. Alguns dos mais populares são o Amazon Alexa Skill Builder, Sayspring e o SDK do Google.

Escrevendo diálogos

Um conjunto compilado de diálogos é o que faz os blocos de construção do fluxo do usuário de voz. Aqui estão algumas dicas para criar um diálogo envolvente e conversacional –

  • Não torne o processo tediosamente longo. Mantenha o número de etapas no mínimo.
  • Você não deve ensinar comandos aos usuários. Isso é algo que é natural. Em vez disso, concentre-se em tornar seu assistente de voz conversacional.
  • Tente manter suas perguntas e respostas breves. Aqui estão os prós e contras.

Não -

Usuário: “Diga-me um bom lugar para comer comida chinesa”
Sistema: “Encontrei cinco lugares para você. O primeiro é “Eat Chinese” está localizado…, a 15 minutos de você, aberto das 8:00 às 20:00, o segundo é o “Chopsticks” que está localizado em…, 1 hora de distância de você,…”

Fazer -
Usuário: “Diga-me um bom lugar para comer comida chinesa”
Sistema: “Existem vários restaurantes chineses na área – você prefere caminhar ou dirigir?”

Identificar erros

Não é melhor identificar os prováveis ​​erros que você pode cometer ao criar diálogos do que consertar a bagunça ampliada mais tarde? Aqui estão algumas coisas das quais você definitivamente deve ficar longe, mas sempre mantenha-as em perspectiva para evitar estados de erro.

  • Ambiguidade – As palavras são inerentemente ambíguas. Ou seja, se uma pessoa diz 'Bom' , pode significar 'Ok' ou simbolizar que está ouvindo. Portanto, informe sua IA de todas as ambiguidades que ocorrem com frequência para obter um desempenho ideal.

  • Erros de ortografia/pronúncia – Ao contrário do papel, as palavras são ditas de forma diferente. Uma única palavra pode ter várias pronúncias, o que pode dificultar o fluxo da conversa entre o usuário e o sistema de processamento de linguagem natural.

  • Não fornecer opções relevantes – Sempre certifique-se de que os usuários estejam obtendo algo valioso e relevante da conversa. Resultados irrelevantes para uma consulta são menos atraentes e ainda menos motivadores para os usuários usarem seu produto novamente.

Mesmo que a consulta não tenha um resultado positivo, seu assistente deve sempre responder e não deixar os usuários parados. Ou seja, se um usuário solicitar “ Reservar um voo para Los Angeles de Dallas para terça-feira ”, o que deve seguir é – “ Não encontrei nenhum voo para terça-feira ”. E o que é ainda melhor – “ Não consegui encontrar nenhum voo para terça-feira. Quer que eu verifique para quarta-feira? ”.

Retrate a identidade da sua marca

Mesmo em conversas humanas, o tom da voz importa muito, pois tem um valor emocional associado a ele. Então, seus diálogos são o que vai se tornar a personalidade do seu produto e deve sempre causar uma impressão positiva na mente dos usuários. Você precisa criar não 'apenas diálogos', mas aqueles que satisfaçam as necessidades emocionais dos usuários.

voice emotion

Use o conteúdo existente

Se você usar os dados à sua disposição (todas as conversas que seu produto tem com o usuário), poderá personalizar bastante a experiência dele. Por exemplo, se um usuário comandar “ Quero pedir macarrão ”, seu sistema deve reverter “ Você gostaria de repetir seu último pedido de macarrão Hakka do Chopstick?

4. Teste seu produto

Depois que tudo estiver próximo da conclusão, é hora de testar as sementes do seu trabalho. Você precisa testar a VUI que projetou para garantir que ela atenda a todos os benchmarks da sua lista de verificação. Existem duas maneiras que você pode usar para testar seu protótipo.

  • Com usuários-alvo

Você pode criar grupos de seu público-alvo e, em seguida, implementar sessões de teste para observar como os usuários estão interagindo com seu produto. Você pode usar essa ocasião para rastrear a taxa de conclusão da tarefa e a pontuação de satisfação do cliente (CSAT).

  • Com simuladores de teste

Semelhante a outros simuladores usados ​​no desenvolvimento de aplicativos móveis, Google e Amazon também fornecem ferramentas para testar o produto projetado. Você pode testar o Alexa Skill e o Google Action do produto em relação aos dispositivos de hardware e suas configurações.

5. Refinar

Depois que seu aplicativo chegar ao mercado, é hora de observar. É hora de entrar em análise de UX. Esta etapa trata de analisar como os usuários estão usando seu produto. Pode ser muito desafiador se você não tiver noção de quais métricas você deve observar. Então, aqui estão os mais proeminentes.

  • Sessões por usuário ou mensagens por sessão
  • Idiomas usados
  • Intenções e enunciados
  • Métricas de engajamento do usuário
  • Fluxos de comportamento

Diretrizes de design para interface de usuário de voz

“As palavras são a fonte de mal-entendidos” – Antoine de Saint-Exupery

Normalmente, as interfaces visuais do usuário também têm problemas que precisam ser resolvidos, mas a frustração de uma interface visual defeituosa não é nada comparada à de uma VUI. Portanto, se o seu assistente de voz projetado não funcionar bem, ele será descartado como uma batata quente.

(Você também pode gostar de ler nosso artigo sobre Visual Storytelling para App UI/UX Design )

Você sabe o que vai ajudá-lo a impedir que isso aconteça? Diretrizes de design de VUI . Então, vamos dar uma olhada neles de uma vez.

  • Não espere que os usuários perguntem primeiro

Ao contrário de uma interface de usuário visual, os usuários podem não conseguir se familiarizar com as funcionalidades imediatamente. Eles podem nem saber como começar. Nesse caso, uma das práticas recomendadas da IU de voz é dar o primeiro passo. Por exemplo, se o seu é um aplicativo de previsão do tempo habilitado por voz , ele pode dizer aos usuários – “ Você pode pedir o tempo de hoje ou uma previsão semanal. ” Além disso, você também deve oferecer uma opção de saída fácil.

  • Mantenha a lista de opções de ação curta

Tip

Até e a menos que você queira sobrecarregar seu usuário logo no início, você precisa se certificar de fornecer apenas as opções mais apropriadas e básicas principalmente.

O conteúdo verbal deve ser o mais conciso e cheio de significado possível, sendo fácil de ser entendido de uma só vez. Conforme recomendado pela Amazon para projetar interfaces de usuário de voz para aplicativos móveis para Alexa, não se deve listar mais de três opções de interação. Fazer isso também garantirá um design UX envolvente da VUI.

  • KISS – Mantenha-o simples e curto

Este princípio é muito útil na concepção de VUIs. Para tornar o desenvolvimento do seu aplicativo de voz o melhor do mercado, você precisa facilitar a compreensão dos comandos pelo seu assistente de voz. Suponha que você esteja projetando uma interação de voz para iniciar uma máquina de chão de fábrica, a maneira mais simples seria atribuir números a essas várias máquinas e depois dar comandos como “ Iniciar máquina 1 ”, etc.

  • Deixe os usuários saberem que estão sendo ouvidos

Lembre-se de como você se sente agitado quando não há sinal de atividade em uma página da Web que acabou de abrir. Agora, multiplique essa frustração no caso da VUI.

Google Voice Assistant

É muito importante manter em perspectiva que seu usuário precisa ser informado quando o dispositivo estiver interagindo ativamente. Você deve dar aos usuários filas sobre quando falar e quando o assistente de voz está ouvindo. Uma imagem acima do Google Assistant mostra como ele representa essa função (com pontos formando uma onda) e com Alexa como mostrado abaixo (luz azulada girando em torno da borda superior do dispositivo).

  • Confirme quando a tarefa for concluída

Assim como você precisa de confirmação depois de fazer qualquer transação, o mesmo é necessário com uma VUI. Caso contrário, como o usuário saberia que a tarefa foi executada?

alexa

Por exemplo, uma vez que o usuário der o comando “ apagar as luzes da cozinha ”, seu assistente deve responder com algo como “Luzes da cozinha apagadas” . Isso eliminará a necessidade de o usuário verificar a tarefa realizada pessoalmente, que é essencialmente o objetivo de ter uma IA baseada em voz.

(Bônus de leitura: Dicas e tendências de design de interface do usuário de aplicativos para dispositivos móveis a serem seguidas em 2020 {Exclusivo} )

Desafios de projetar VUI

Como todo o resto, a interface baseada em voz também sofre com o calcanhar de Aquiles . Na verdade, não há um, mas muitos. Então, quais são os desafios que os designers de VUI costumam encontrar e, na maioria das vezes, não conseguem reconhecer ou resolver?

  • Privacidade e segurança

O fato de esses assistentes de IA baseados em voz estarem sempre esperando por filas ouvindo os sons de seu ambiente representa uma grande preocupação para os usuários. A paranóia de sua privacidade sendo adulterada também não é irracional.

Inicialmente, assistentes de voz como Alexa armazenavam todas as conversas que encontravam, o que é um grande risco de IA de voz aos olhos dos usuários. Algo de pesadelo aconteceu com um casal quando Alexa foi pega enviando suas gravações secretas para um estranho. Agora, alguns assistentes excluem automaticamente as conversas armazenadas a cada 24 horas. No entanto, isso tem um custo adicional e atrito na interface do usuário.

  • Transmita o que os assistentes de voz não podem realizar

Torna-se um desafio para os designers de UI e UX de voz explicar aos usuários finais o que o Voice AI não pode fazer. Por exemplo, ao usar o Google Assistente quando você diz “ Fazer um evento chamado Reunião da equipe de vendas para terça-feira às 2 horas ”, ele cria um cartão de evento instantaneamente e pergunta mais tarde “ Deseja salvar este evento?

Mas e se você precisar alterar o local ou o horário da reunião mais tarde, e daí? Ele responderia “ Não tenho certeza sobre o que você disse, você gostaria que eu salvasse este evento? ”. Para evitar a experiência ruim do usuário, a IA poderia simplesmente dizer “ desculpe, ainda estou trabalhando para adicionar locais ”.

  • Dificuldade em prototipar e testar

Outro desafio enfrentado pelos designers é a prototipagem e teste de UI de voz. Suponha que você tenha criado um protótipo e queira testá-lo. Você deu o aviso inicial de que os usuários podem comprar mantimentos com seu assistente de voz.

O desafio começa aqui – os usuários podem dizer uma coisa particular em estilos diferentes, algo que é difícil de acompanhar. Torna-se ainda mais difícil testar o protótipo em tais consultas quando ainda não está totalmente desenvolvido com a tecnologia de pesquisa por voz .

  • Suporte de idioma

Como o principal princípio da tecnologia de voz é o idioma, torna-se crucial que qualquer IA baseada em voz seja fluente na compreensão e na fala. Infelizmente, a tecnologia só se desenvolveu em relação a alguns idiomas até agora. No entanto, adicionar outros idiomas e sotaques distintos à interface ainda é um trabalho em andamento.

Futuro da VUI

Como um ritual, somos obrigados a olhar para as perspectivas futuras de cada tecnologia e a voz não é diferente. Pelo que coletamos dos casos de uso da interface de voz , como o Alexa, sabemos que a integração da tecnologia de voz por si só não pode atender aos requisitos diários dos usuários.

Quote3 (2)

A melhor maneira de ser completamente adotado é apertando as mãos com a interface visual do usuário – assim como o Google Assistant e o Siri. A VUI e a interface visual do usuário juntas podem equilibrar as deficiências umas das outras, proporcionando aos usuários uma incrível experiência de assistente de voz . Além disso, isso permitirá que eles realizem tarefas complexas com comandos de voz simples, que é o que as interfaces de voz carecem neste momento de seu desenvolvimento.

E quem sabe quando esta década terminar, todos nós poderemos ter nosso Jarvis e seremos capazes de fazer tudo como Tony Stark sem uma exibição física.

Nota Final

As VUIs vieram para ficar e serão integradas em cada vez mais produtos no futuro. Esperamos que nosso blog tenha sido útil para esclarecer todas as suas dúvidas sobre o design de interfaces de usuário de voz. Mas, caso você ainda tenha alguma dúvida ou queira saber mais sobre VUI, você pode se conectar com nossa equipe e nossos especialistas terão prazer em ajudá-lo com soluções inovadoras.