Guide pratique pour une conception d'interface utilisateur vocale parfaite
Publié: 2020-02-10Depuis que j'ai vu la première partie d'Iron Man, j'ai été fasciné par le potentiel de la technologie de l'IA Tony, trop bien avec son assistant IA Jarvis.
Mais salut! Nous sommes déjà à mi-chemin, non pas dans la vraie vie, mais dans la vraie vie.
Vous souvenez-vous d'avoir utilisé Siri pour la première fois sur iPhone 4S ? C'était un sentiment d'un autre monde, n'est-ce pas ? Et depuis lors, nous savons tous jusqu'où nous sommes allés - Alexa , Google Assistant , Cortona et une centaine d'autres.
Donc, en tant que designer inspiré, si vous êtes aussi fasciné que moi et que vous voulez donner une chance à l'IA basée sur la voix, vous devez affiner vos compétences et vos connaissances sur la façon de concevoir des interfaces utilisateur vocales .
Heureusement, vous êtes tombé sur le bon article. Voici tout ce que vous voudriez et devez savoir sur VUI et ce qui en fait un élément important de la conception intuitive de la recherche d'applications.
Qu'est-ce que l'interface utilisateur vocale (VUI) ?
Acronyme de Voice user Interface, VUI est l'interface qui permet aux utilisateurs d'interagir avec un système via des commandes vocales. Les exemples d'interface utilisateur vocale les plus populaires et les plus populaires sont Google Assistant, Siri et Alexa d'Amazon.
Le plus grand avantage des VUI est qu'elles permettent d'interagir avec un système sans les yeux et sans les mains.
Semblable aux applications mobiles exécutées sur n'importe quel système d'exploitation et n'importe quel appareil, VUI contient trois couches qui doivent fonctionner ensemble pour des interactions vocales efficaces. Ici, chacune des trois couches utilise la couche qui se trouve en dessous tout en supportant celle du dessus. Ce sont les deux couches supérieures dans lesquelles se trouve l'interface vocale, résidant dans le cloud et non sur l'appareil.
Étapes de conception de l'interface utilisateur vocale
1. Faites des recherches sur votre public
Dans ce processus de conception de VUI, vous devez utiliser la conception axée sur l'utilisateur comme vous le feriez lors de la conception d'autres produits numériques. L'objectif principal ici est de recueillir des informations et de comprendre le comportement et les besoins des utilisateurs, car ces informations constituent la base des exigences du produit.
Ce sur quoi vous devriez vous concentrer à ce stade est -
- Identifiez les points faibles des utilisateurs et comment est leur expérience. Ce faisant, vous pourrez analyser où les utilisateurs peuvent en bénéficier.
- Vous devez recueillir des informations sur la langue de l'utilisateur - comment il parle et les phrases qu'il utilise en parlant. Cela vous aidera à concevoir un système pour différents énoncés.
2 . Définir
À ce stade, vous devez définir les capacités et façonner le produit. Ceci comprend -
- Créer des scénarios clés d'interaction
Ces scénarios précèdent les idées spécifiques de l'application et doivent être identifiés afin d'être transformés en flux de dialogue conversationnel. Ils sont un moyen de réfléchir à la raison pour laquelle quelqu'un aurait besoin d'utiliser un VUI. Vous devez donc concevoir des scénarios ayant une grande valeur pour vos utilisateurs.
Parfois, il peut être déroutant de savoir quels scénarios sont importants et lesquels peuvent être ignorés. À cette fin, vous pouvez utiliser une matrice de cas d'utilisation pour évaluer chacun d'eux.
- Assurez-vous que ces scénarios fonctionnent avec la voix
Ce qui compte le plus ici, c'est que les utilisateurs soient capables de résoudre un problème spécifique plus efficacement qu'ils ne le pourraient avec les alternatives. Le but de cette étape est de trouver les cas communs et particuliers dont les utilisateurs bénéficieront.
Parmi de nombreux, quelques cas sont - A. lorsque les utilisateurs sont préoccupés et ne peuvent pas utiliser l'interface utilisateur visuelle, et B. lorsqu'ils veulent faire quelque chose rapidement. C'est-à-dire que commander au VUI de " jouer de la musique " prend beaucoup moins de temps que de le faire manuellement.
- Les trois facteurs - Intention, Énoncé, Slot
Comprenons ces deux avec l'exemple mentionné ci-dessus de " Jouez de la musique ".
Intention - Il décrit essentiellement l'objectif plus large de la commande vocale. Il existe deux types d'intentions – A. Haute utilité (commande très spécifique et simple, c'est-à-dire « allumer les lumières dans le salon ») et B. Faible utilité (plus vague et difficile à déchiffrer). Dans notre cas, il s'agit d'une interaction à haute utilité.
Énoncé - Il traite des façons possibles dont les utilisateurs peuvent formuler une demande. Dans notre cas, l'alternative à « Joue de la musique » pourrait être n'importe quoi de « Je veux entendre de la musique » à « Pouvez-vous jouer une chanson » et ainsi de suite. Tous les concepteurs UI/UX de VUI doivent tenir compte des variations.
Machines à sous – Lorsque l'intention n'est pas suffisante, les machines à sous entrent en action. Ils font référence aux informations supplémentaires nécessaires pour fournir les meilleurs résultats pour la requête. Ils peuvent être facultatifs et obligatoires. Dans notre exemple, le slot est 'relaxant' mais il est facultatif puisque la catégorie de musique n'est pas définie par l'utilisateur. Cependant, si la commande était « réserver un taxi sur Uber », le créneau serait «destination», donc obligatoire.
3. Créez un prototype
Le dialogue flow est la réponse à la question « comment créer une interaction vocale entre l'utilisateur et la technologie » . Le processus commence par la création d'un flux de dialogue pour chaque exigence que vous souhaitez cibler avec votre produit.
Ce sont les points suivants qu'un flux de dialogue doit couvrir - Principaux mots-clés pour l'interaction, branches probables vers lesquelles la conversation pourrait se diriger et exemples de dialogues pour les utilisateurs et les assistants.
Un flux de dialogue dans notre cas n'est rien d'autre qu'un prototype illustrant les allers-retours entre les utilisateurs et les assistants vocaux. Regardons un flux de dialogue illustré ci-dessous pour une meilleure compréhension.
Vous pouvez utiliser plusieurs outils de prototypage à votre disposition pour VUI. Certains des plus populaires sont Amazon Alexa Skill Builder, Sayspring et le SDK de Google.
Ecrire des dialogues
Un ensemble compilé de dialogues est ce qui constitue les éléments constitutifs du flux d'utilisateurs vocaux. Voici quelques conseils pour créer un dialogue engageant et conversationnel -
- Ne rendez pas le processus fastidieusement long. Gardez le nombre d'étapes au minimum.
- Vous ne devez pas enseigner les commandes aux utilisateurs. C'est quelque chose de naturel. Au lieu de cela, concentrez-vous sur le fait de rendre votre assistant vocal conversationnel.
- Essayez de garder vos questions et réponses brèves. Voici les choses à faire et à ne pas faire.
Ne -
Utilisateur : "Dis-moi un bon endroit pour manger de la cuisine chinoise"
Système : « Je t'ai trouvé cinq places. Le premier est « Eat Chinese » est situé…, à 15 minutes de chez vous, ouvert de 8h00 à 20h00, le second est « Chopsticks » qui est situé sur…, à 1h de chez vous,… »
Faire -
Utilisateur : "Dis-moi un bon endroit pour manger de la cuisine chinoise"
Système : « Il y a plusieurs restaurants chinois dans le coin, préférez-vous marcher ou conduire ? »
Identifier les erreurs
N'est-il pas préférable d'identifier les erreurs probables que vous pouvez commettre lors de la création de dialogues plutôt que de réparer le désordre grossi plus tard ? Voici quelques éléments que vous devez absolument éviter, mais gardez-les toujours en perspective pour éviter les états d'erreur.
- Ambiguïté - Les mots sont intrinsèquement ambigus. Cela signifie que si une personne dit «Bon», cela pourrait signifier «D'accord» ou symboliser qu'elle écoute. Alors, informez votre IA de toutes les ambiguïtés courantes pour des performances optimales.
- Fautes d'orthographe / mauvaise prononciation - Contrairement au papier, les mots sont prononcés différemment. Un seul mot peut avoir plusieurs prononciations, ce qui peut entraver le flux de conversation entre l'utilisateur et le système de traitement du langage naturel.
- Ne pas fournir d'options pertinentes - Assurez-vous toujours que les utilisateurs obtiennent quelque chose de précieux et de pertinent de la conversation. Les résultats non pertinents pour une requête sont les moins attrayants et encore moins un facteur de motivation pour les utilisateurs à utiliser à nouveau votre produit.
Même si la requête n'a pas de résultat positif, votre assistant doit toujours répondre et ne pas laisser les utilisateurs en suspens. C'est-à-dire que si un utilisateur demande « Réserver un vol pour Los Angeles depuis Dallas pour mardi », ce qui devrait suivre est : « Je n'ai trouvé aucun vol pour mardi ». Et ce qui est encore mieux, c'est – « Je n'ai trouvé aucun vol pour mardi. Voulez-vous que je vérifie pour mercredi ? ”.
Décrivez l'identité de votre marque
Même dans les conversations humaines, le ton de la voix compte beaucoup car il a une valeur émotionnelle qui lui est attachée. Ensuite, vos dialogues sont ce qui va devenir la personnalité de votre produit et cela devrait toujours faire une impression positive dans l'esprit des utilisateurs. Vous devez créer non seulement des dialogues, mais ceux qui satisfont les besoins émotionnels des utilisateurs.
Utiliser le contenu existant
Si vous utilisez les données à votre disposition (toutes les conversations que votre produit a avec l'utilisateur), vous pouvez grandement personnaliser son expérience. Par exemple, si un utilisateur commande « Je veux commander des nouilles », votre système doit revenir en arrière : « Voulez-vous répéter votre dernière commande de nouilles Hakka auprès de Chopstick ? ”
4. Testez votre produit
Une fois que tout est presque terminé, il est temps de tester les graines de votre travail. Vous devez tester le VUI que vous avez conçu pour vous assurer qu'il répond à tous les critères de votre liste de contrôle. Vous pouvez utiliser deux méthodes pour tester votre prototype.
- Avec les utilisateurs cibles
Vous pouvez créer des groupes de votre public cible, puis mettre en œuvre des sessions de test pour observer comment les utilisateurs interagissent avec votre produit. Vous pouvez utiliser cette occasion pour suivre le taux d'achèvement des tâches et le score de satisfaction client (CSAT).
- Avec des simulateurs de test
Semblables à d'autres simulateurs utilisés dans le développement d'applications mobiles, Google et Amazon fournissent également des outils pour tester le produit conçu. Vous pouvez tester la compétence Alexa et l' action Google du produit en ce qui concerne les périphériques matériels et leurs paramètres.
5. Affiner
Une fois que votre application a atterri sur le marché, il est temps d'observer. Il est temps de se livrer à l'analyse UX. Cette étape consiste à analyser comment les utilisateurs utilisent votre produit. Cela peut être très difficile si vous ne savez pas quelles mesures vous êtes censé observer. Donc, voici les plus importants.
- Sessions par utilisateur ou messages par session
- Langues utilisées
- Intentions et énoncés
- Métriques d'engagement des utilisateurs
- Flux de comportement
Directives de conception pour l'interface utilisateur vocale
"Les mots sont la source des malentendus" - Antoine de Saint-Exupéry
Normalement, les interfaces utilisateur visuelles ont également des problèmes qui doivent être résolus, mais la frustration d'une interface visuelle défectueuse n'est rien comparée à celle d'une VUI. Ainsi, si votre assistant vocal conçu ne fonctionne pas correctement, il sera abandonné comme une patate chaude.
(Vous pouvez également lire notre article sur la narration visuelle pour la conception d'interface utilisateur/UX d'application )
Vous savez ce qui vous aidera à empêcher que cela se produise ? – Directives de conception VUI . Alors, jetons un coup d'œil à eux à la fois.
N'attendez pas que les utilisateurs demandent d'abord
Contrairement à une interface utilisateur visuelle, les utilisateurs peuvent ne pas être en mesure de se familiariser immédiatement avec les fonctionnalités. Ils ne savent peut-être même pas par où commencer. Dans ce cas, l'une des meilleures pratiques de l'interface utilisateur vocale consiste à faire le premier pas. Par exemple, si la vôtre est une application météo mobile à commande vocale , elle pourrait dire aux utilisateurs : « Vous pouvez demander la météo du jour ou des prévisions hebdomadaires. ” En outre, vous devez également proposer une option de sortie facile.
Gardez la liste des options d'action courte
Jusqu'à et à moins que vous ne vouliez submerger votre utilisateur dès le début, vous devez vous assurer que vous ne fournissez que les options les plus appropriées et les plus basiques.
Le contenu verbal doit être aussi concis et plein de sens que possible tout en étant facile à comprendre en une seule fois. Comme recommandé par Amazon pour la conception d'interfaces utilisateur vocales pour les applications mobiles pour Alexa, il ne faut pas énumérer plus de trois options d'interaction. Cela garantira également une conception UX engageante du VUI.
KISS – Restez simple et court
Ce principe est très utile dans la conception de VUI. Pour que le développement de votre application vocale soit le meilleur, vous devez faciliter la compréhension des commandes par votre assistant vocal. Supposons que vous conceviez une interaction vocale pour démarrer une machine d'atelier, le moyen le plus simple serait d'attribuer à ces multiples machines des numéros, puis de donner des commandes telles que " Démarrer la machine 1 ", etc.
Faites savoir aux utilisateurs qu'ils sont entendus
Rappelez-vous à quel point vous vous sentez agité lorsqu'il n'y a aucun signe d'activité sur une page Web que vous venez d'ouvrir. Maintenant, multipliez cette frustration dans le cas de VUI.
Il est très important de garder à l'esprit que votre utilisateur doit être informé lorsque l'appareil interagit activement. Vous devez indiquer aux utilisateurs quand parler et quand l'assistant vocal écoute. Une image ci-dessus de Google Assistant montre comment il représente cette fonction (avec des points formant une vague) et avec Alexa comme indiqué ci-dessous (lumière bleuâtre tourbillonnant autour du bord supérieur de l'appareil).
Confirmer lorsque la tâche est terminée
Tout comme vous avez besoin d'une confirmation après avoir effectué une transaction, la même chose est nécessaire avec un VUI. Sinon, comment l'utilisateur saurait-il que la tâche a été effectuée ?
Par exemple, une fois que l'utilisateur donne la commande " éteindre les lumières de la cuisine ", votre assistant doit répondre par quelque chose comme " Lumières de la cuisine éteintes " . Cela éliminera le besoin pour l'utilisateur de vérifier la tâche effectuée en personne, ce qui est essentiellement l'intérêt d'avoir une IA basée sur la voix.
(Bonus Read : Conseils et tendances de conception d'interface utilisateur d'application mobile à suivre en 2020 {Exclusif} )
Les défis de la conception de VUI
Comme tout le reste, l'interface vocale souffre également du talon d'Achille . En fait, il n'y en a pas un mais plusieurs. Alors, quels sont les défis que les concepteurs de VUI rencontrent souvent et, le plus souvent, ne parviennent pas à reconnaître ou à résoudre ?
Confidentialité et sécurité
Le fait que ces assistants vocaux IA attendent toujours des files d'attente en écoutant les sons de leur environnement pose une grande préoccupation aux utilisateurs. La paranoïa de la violation de leur vie privée n'est pas non plus irrationnelle.
Au départ, les assistants vocaux comme Alexa stockaient toutes les conversations qu'ils rencontraient, ce qui représente un gros risque d'IA vocale aux yeux des utilisateurs. Quelque chose d'un cauchemar est arrivé à un couple quand Alexa a été surprise en train d'envoyer leurs enregistrements secrets à un inconnu. Désormais, certains assistants suppriment automatiquement les conversations stockées toutes les 24 heures environ. Cependant, ceux-ci entraînent des coûts supplémentaires et des frictions d'interface utilisateur.
Transmettre ce que les assistants vocaux ne peuvent pas faire
Il devient difficile pour les concepteurs d'interface utilisateur vocale et d'UX d'expliquer aux utilisateurs finaux ce que l'IA vocale ne peut pas faire. Par exemple, lors de l'utilisation de l'Assistant Google, lorsque vous dites " Créer un événement nommé Réunion de l'équipe commerciale pour mardi à 14 heures ", il crée instantanément une carte d'événement et demande plus tard " Voulez-vous enregistrer cet événement ? ”
Mais que se passe-t-il si vous avez besoin de changer le lieu ou l'heure de la réunion plus tard, que se passe-t-il alors ? Il répondrait « Je ne suis pas sûr de ce que vous avez dit, voulez-vous que je sauvegarde cet événement ? ”. Pour éviter la mauvaise expérience utilisateur, l'IA pourrait simplement dire " désolé, je travaille toujours sur l'ajout d'emplacements ".
Difficulté de prototypage et de test
Un autre défi auquel sont confrontés les concepteurs est le prototypage et les tests de l'interface utilisateur vocale. Supposons que vous ayez créé un prototype et que vous souhaitiez le tester. Vous avez donné l'invite initiale aux utilisateurs de faire leurs courses avec votre assistant vocal.
Le défi commence ici - Les utilisateurs peuvent dire une chose particulière dans différents styles, quelque chose qui est difficile à suivre. Il devient d'autant plus difficile de tester le prototype sur de telles requêtes lorsqu'il n'est pas encore totalement développé avec la technologie de recherche vocale .
Prise en charge de la langue
Étant donné que le principe principal de la technologie vocale est le langage, il devient crucial pour toute IA basée sur la voix de maîtriser à la fois la compréhension et la parole. Malheureusement, la technologie ne s'est développée que pour quelques langues pour le moment. Néanmoins, l'ajout d'autres langues et d'accents distincts à l'interface est toujours un travail en cours.
L'avenir de VUI
Comme un rituel, nous sommes obligés de regarder les perspectives d'avenir de chaque technologie et la voix n'est pas différente. D'après ce que nous avons recueilli des cas d'utilisation d'interface vocale tels qu'Alexa, nous savons que l'intégration de la technologie vocale ne peut à elle seule répondre aux besoins quotidiens des utilisateurs.
La meilleure façon de l'adopter complètement est de serrer la main de l'interface utilisateur visuelle, tout comme Google Assistant et Siri. La VUI et l'interface utilisateur visuelle peuvent compenser les lacunes de l'autre, offrant aux utilisateurs une expérience d'assistant vocal incroyable . De plus, cela leur permettra d'effectuer des tâches complexes avec de simples commandes vocales, ce qui manque aux interfaces vocales à ce stade de leur développement.
Et qui sait à la fin de cette décennie, nous pourrions tous avoir notre Jarvis et serions capables de tout faire comme Tony Stark sans affichage physique.
Remarque finale
Les VUI sont là pour rester et seront intégrées dans de plus en plus de produits à l'avenir. Nous espérons que notre blog a été utile pour dissiper tous vos doutes concernant la conception d'interfaces utilisateur vocales. Mais si vous avez encore des questions ou souhaitez en savoir plus sur VUI, vous pouvez vous connecter avec notre équipe et nos experts se feront un plaisir de vous aider avec des solutions innovantes.