Anleitung für ein makelloses Design der Sprachbenutzeroberfläche

Veröffentlicht: 2020-02-10

Seit ich den ersten Teil von Iron Man gesehen habe, bin ich fasziniert vom Potenzial der KI-Technologie Tony, allzu gut mit seinem KI-Assistenten Jarvis.

Aber hey! Wir sind bereits auf halbem Weg, nicht in der Rolle, sondern im wirklichen Leben.

Denken Sie daran, Siri zum ersten Mal auf dem iPhone 4S zu verwenden? Es war ein jenseitiges Gefühl, nicht wahr? Und seitdem wissen wir alle, wie weit wir gekommen sind – Alexa , Google Assistant , Cortona und hundert mehr.

Wenn Sie also als inspirierter Designer genauso fasziniert sind wie ich und der sprachbasierten KI eine Chance geben möchten, dann müssen Sie Ihre Fähigkeiten und Ihr Wissen zum Entwerfen von Sprachbenutzeroberflächen verbessern .

Zum Glück sind Sie auf den richtigen Artikel gestoßen. Hier finden Sie alles, was Sie über VUI wissen möchten und müssen und was sie zu einem wichtigen Bestandteil des intuitiven App-Suchdesigns macht.

Was ist VUI (Voice User Interface)?

Akronym für Voice User Interface, VUI ist die Schnittstelle, die es Benutzern ermöglicht, über Sprachbefehle mit einem System zu interagieren. Die beliebtesten und besten Beispiele für Sprachbenutzeroberflächen sind Google Assistant, Siri und Alexa von Amazon.

Der größte Vorteil von VUIs besteht darin, dass sie eine augen- und freihändige Interaktion mit einem System ermöglichen.

Ähnlich wie mobile Apps, die auf jedem Betriebssystem und Gerät ausgeführt werden, enthält VUI drei Ebenen, die für effiziente Sprachinteraktionen zusammenarbeiten müssen. Hier nutzt jede der drei Schichten die darunter liegende Schicht, während sie die darüber liegende unterstützt. Es sind die oberen beiden Schichten, in denen sich die Sprachschnittstelle befindet, die sich in der Cloud und nicht auf dem Gerät befindet.

interaction layers of VUI

Schritte zum Entwerfen einer Sprachbenutzeroberfläche

1. Recherchieren Sie Ihr Publikum

Bei diesem Prozess des VUI-Designs müssen Sie ein nutzerorientiertes Design anwenden, genau wie Sie es beim Design anderer digitaler Produkte tun würden. Das primäre Ziel ist hier, Informationen zu sammeln und das Verhalten und die Bedürfnisse der Benutzer zu verstehen, da diese Informationen die Grundlage für die Produktanforderungen bilden.

Worauf Sie sich in dieser Phase konzentrieren sollten, ist –

  • Identifizieren Sie die Schmerzpunkte der Benutzer und wie ihre Erfahrung ist. Auf diese Weise können Sie analysieren, wo die Benutzer profitieren können.
  • Sie müssen Informationen über die Benutzersprache sammeln – wie sie sprechen und welche Sätze sie beim Sprechen verwenden. Dies wird Ihnen helfen, ein System für verschiedene Äußerungen zu entwerfen.

2 . Definieren

In dieser Phase müssen Sie die Fähigkeiten definieren und das Produkt gestalten. Das beinhaltet -

  • Erstellen von Schlüsselszenarien der Interaktion

Diese Szenarien kommen vor den spezifischen Ideen der App und sollten identifiziert werden, um in einen Konversationsdialogfluss umgewandelt zu werden. Sie sind eine Möglichkeit, darüber nachzudenken, warum jemand eine VUI verwenden sollte. Sie müssen also Szenarien entwerfen, die für Ihre Benutzer von hohem Wert sind.

Manchmal kann es verwirrend sein, welche Szenarien wichtig sind und welche ignoriert werden können. Zu diesem Zweck können Sie jeden von ihnen anhand einer Anwendungsfallmatrix bewerten.

matrix of Voice Interaction cases

  • Stellen Sie sicher, dass diese Szenarien mit Sprache funktionieren

Hier kommt es vor allem darauf an, dass die Anwender ein bestimmtes Problem effizienter lösen können, als dies mit den Alternativen möglich wäre. Das Ziel dieses Schritts ist es, die allgemeinen und speziellen Fälle zu finden, von denen die Benutzer profitieren.

Unter vielen sind einige wenige Fälle – A. wenn Benutzer beschäftigt sind und die visuelle Benutzeroberfläche nicht verwenden können, und B. wenn sie schnell etwas erledigen möchten. Das heißt, der VUI zu befehlen, „ Musik abzuspielen “, ist viel weniger zeitaufwändig als es manuell zu tun.

  • Die drei Faktoren – Absicht, Äußerung, Slot

Lassen Sie uns diese beiden anhand des oben erwähnten Beispiels „ Musik spielen “ verstehen.

Absicht – Es zeigt im Grunde das breitere Ziel des Sprachbefehls. Es gibt zwei Arten von Absichten – A. Hoher Nutzen (sehr spezifischer und direkter Befehl, z. B. „Schalte das Licht im Wohnzimmer ein) und B. Niedriger Nutzen (vage und schwer zu entschlüsseln). In unserem Fall handelt es sich um eine Interaktion mit hohem Nutzen.
Äußerung – Es befasst sich mit den Möglichkeiten, wie Benutzer eine Anfrage formulieren können. In unserem Fall könnte die Alternative zu „ Spiel etwas Musik “ alles mögliche sein von „ Ich möchte etwas Musik hören “ bis „ Kannst du ein Lied spielen “ und so weiter. Alle UI/UX-Designer von VUI müssen die Variationen berücksichtigen.

Spielautomaten – Wenn die Absicht nicht ausreicht, kommen Spielautomaten zum Einsatz. Sie beziehen sich auf die zusätzlichen Informationen, die benötigt werden, um die besten Ergebnisse für die Abfrage zu liefern. Sie können optional und erforderlich sein. In unserem Beispiel ist der Slot „entspannend“, aber er ist optional, da die Musikkategorie nicht vom Benutzer definiert wird. Wenn der Befehl jedoch " Buchen Sie ein Taxi bei Uber " lautete, wäre der Slot "Ziel" und daher erforderlich.

3. Erstellen Sie einen Prototyp

Der Dialogfluss ist die Antwort auf die Frage, „wie man eine Sprachinteraktion zwischen Benutzer und Technologie herstellt“ . Der Prozess beginnt mit der Erstellung eines Dialogflusses für jede Anforderung, die Sie mit Ihrem Produkt ansprechen möchten.

Dies sind die folgenden Punkte, die ein Dialogablauf abdecken sollte – Hauptschlüsselwörter für die Interaktion, wahrscheinliche Verzweigungen, in die die Konversation führen könnte, und Beispieldialoge für Benutzer und Assistenten.

Ein Dialogfluss ist in unserem Fall nichts anderes als ein Prototyp, der die Hin- und Her-Gespräche zwischen Benutzern und Sprachassistenten veranschaulicht. Schauen wir uns zum besseren Verständnis unten einen illustrierten Dialogablauf an.

voice interaction between user and technology flowchart

Sie können mehrere Prototyping-Tools verwenden, die Ihnen für VUI zur Verfügung stehen. Einige der beliebtesten sind Amazon Alexa Skill Builder, Sayspring und Googles SDK.

Dialoge schreiben

Ein kompilierter Satz von Dialogen macht die Bausteine ​​des Sprachbenutzerflusses aus. Hier sind ein paar Tipps für die Erstellung ansprechender und dialogorientierter Dialoge –

  • Machen Sie den Prozess nicht mühsam lang. Halten Sie die Anzahl der Schritte auf ein Minimum.
  • Sie sollten den Benutzern keine Befehle beibringen. Das ist etwas Natürliches. Konzentrieren Sie sich stattdessen darauf, Ihren Sprachassistenten gesprächig zu machen.
  • Versuchen Sie, Ihre Fragen und Antworten kurz zu halten. Hier sind die Gebote und Verbote.

Nicht –

Benutzer: „Sag mir einen guten Ort, um chinesische Küche zu essen“
System: „Ich habe fünf Plätze für dich gefunden. Das erste ist „Eat Chinese“ befindet sich…, 15 Minuten von Ihnen entfernt, geöffnet von 8:00 bis 20:00 Uhr, das zweite ist „Chopsticks“ und befindet sich in…, 1 Stunde von Ihnen entfernt,…“

Machen -
Benutzer: „Sag mir einen guten Ort, um chinesische Küche zu essen“
System: „Es gibt mehrere chinesische Restaurants in der Umgebung – möchten Sie lieber zu Fuß gehen oder mit dem Auto fahren?“

Fehler erkennen

Ist es nicht besser, die wahrscheinlichen Fehler zu identifizieren, die Sie beim Erstellen von Dialogen machen können, als das vergrößerte Durcheinander später zu beheben? Hier sind ein paar Dinge, von denen Sie unbedingt die Finger lassen sollten, aber immer im Auge behalten sollten, um Fehlerzustände zu vermeiden.

  • Mehrdeutigkeit – Wörter sind von Natur aus mehrdeutig. Das heißt, wenn eine Person „Gut“ sagt, könnte dies „Okay“ bedeuten oder symbolisieren, dass sie zuhört. Machen Sie Ihre KI also auf alle häufig auftretenden Mehrdeutigkeiten aufmerksam, um eine optimale Leistung zu erzielen.

  • Rechtschreibfehler/falsche Aussprache – Anders als auf dem Papier werden Wörter anders ausgesprochen. Ein einzelnes Wort könnte mehrere Aussprachen haben, was den Konversationsfluss zwischen dem Benutzer und dem Verarbeitungssystem für natürliche Sprache behindern könnte.

  • Keine relevanten Optionen bereitstellen – Stellen Sie immer sicher, dass die Benutzer etwas Wertvolles und Relevantes aus der Konversation ziehen. Irrelevante Ergebnisse für eine Suchanfrage sind am wenigsten attraktiv und noch weniger motivierend für Nutzer, Ihr Produkt erneut zu verwenden.

Auch wenn die Abfrage kein positives Ergebnis hat, sollte Ihr Assistent immer antworten und die Nutzer nicht hängen lassen. Das heißt, wenn ein Benutzer „ Buche einen Flug von Dallas nach LA für Dienstag “ anfordert, sollte Folgendes folgen: „ Ich konnte keine Flüge für Dienstag finden “. Und was noch besser ist – „ Ich konnte keine Flüge für Dienstag finden. Soll ich nach Mittwoch sehen? “.

Stellen Sie die Identität Ihrer Marke dar

Auch in menschlichen Gesprächen spielt der Tonfall eine große Rolle, da er einen emotionalen Wert hat. Dann sind es Ihre Dialoge, die die Persönlichkeit Ihres Produkts ausmachen und es sollte immer einen positiven Eindruck in den Köpfen der Benutzer hinterlassen. Sie müssen nicht „nur Dialoge“ erstellen, sondern diejenigen, die die emotionalen Bedürfnisse der Benutzer befriedigen.

voice emotion

Verwenden Sie vorhandene Inhalte

Wenn Sie die Ihnen zur Verfügung stehenden Daten verwenden (alle Gespräche, die Ihr Produkt mit dem Benutzer führt), können Sie seine Erfahrung stark personalisieren. Wenn ein Benutzer beispielsweise „ Ich möchte Nudeln bestellen “ befiehlt, sollte Ihr System zurücksetzen „ Möchten Sie Ihre letzte Bestellung von Hakka-Nudeln von Chopstick wiederholen?

4. Testen Sie Ihr Produkt

Nachdem alles fast abgeschlossen ist, ist es an der Zeit, die Saat Ihrer Arbeit zu testen. Sie müssen das von Ihnen entworfene VUI testen, um sicherzustellen, dass es alle Benchmarks auf Ihrer Checkliste erfüllt. Es gibt zwei Möglichkeiten, wie Sie Ihren Prototyp testen können.

  • Mit Zielbenutzern

Sie können Gruppen Ihrer Zielgruppe erstellen und dann Testsitzungen implementieren, um zu beobachten, wie Benutzer mit Ihrem Produkt interagieren. Sie können diese Gelegenheit nutzen, um die Abschlussrate von Aufgaben und den Kundenzufriedenheitswert (CSAT) zu verfolgen.

  • Mit Testsimulatoren

Ähnlich wie bei anderen Simulatoren, die bei der Entwicklung mobiler Apps verwendet werden, bieten Google und Amazon auch Tools zum Testen des entworfenen Produkts an. Sie können den Alexa Skill und die Google Action des Produkts in Bezug auf die Hardwaregeräte und deren Einstellungen testen.

5. Verfeinern

Nachdem Ihre App auf dem Markt gelandet ist, ist es Zeit für eine Beobachtung. Es ist an der Zeit, sich der UX-Analyse zu widmen. In dieser Phase geht es um die Analyse, wie die Benutzer Ihr Produkt verwenden. Es kann eine große Herausforderung sein, wenn Sie keine Ahnung haben, welche Metriken Sie beobachten sollen. Hier sind also die prominentesten.

  • Sitzungen pro Benutzer oder Nachrichten pro Sitzung
  • Verwendete Sprachen
  • Absichten und Äußerungen
  • Metriken zur Benutzerinteraktion
  • Verhalten fließt

Designrichtlinien für die Sprachbenutzeroberfläche

„Worte sind die Quelle von Missverständnissen“ – Antoine de Saint-Exupéry

Normalerweise gibt es auch bei visuellen Benutzeroberflächen Probleme, die behoben werden müssen, aber die Frustration über eine fehlerhafte visuelle Benutzeroberfläche ist nichts im Vergleich zu der einer VUI. Wenn Ihr entworfener Sprachassistent also nicht gut funktioniert, wird er wie eine heiße Kartoffel fallen gelassen.

(Vielleicht möchten Sie auch unseren Artikel über Visual Storytelling für App UI/UX Design lesen )

Weißt du, was dir helfen wird, das zu verhindern? VUI-Designrichtlinien . Schauen wir sie uns also gleich einmal an.

  • Warten Sie nicht, bis Benutzer zuerst fragen

Im Gegensatz zu einer visuellen Benutzeroberfläche können sich Benutzer möglicherweise nicht sofort mit den Funktionen vertraut machen. Sie wissen vielleicht nicht einmal, wie sie anfangen sollen. In diesem Fall besteht eine der Best Practices für Voice UI darin, den ersten Schritt zu tun. Wenn es sich bei Ihrer beispielsweise um eine sprachgesteuerte mobile Wetter-App handelt, könnte sie den Benutzern sagen: „ Sie können nach dem heutigen Wetter oder einer wöchentlichen Vorhersage fragen. „Darüber hinaus sollten Sie auch eine einfache Exit-Option anbieten.

  • Halten Sie die Liste der Handlungsoptionen kurz

Tip

Solange Sie Ihren Benutzer nicht gleich zu Beginn überfordern möchten, müssen Sie sicherstellen, dass Sie in erster Linie nur die geeignetsten und grundlegendsten Optionen bereitstellen.

Die verbalen Inhalte müssen möglichst prägnant und aussagekräftig sein und dabei auf einen Schlag gut verständlich sein. Wie von Amazon für die Gestaltung von Voice-Benutzeroberflächen für mobile Apps für Alexa empfohlen, darf man nicht mehr als drei Interaktionsmöglichkeiten auflisten. Dadurch wird auch ein ansprechendes UX-Design der VUI sichergestellt.

  • KISS – Halten Sie es einfach und kurz

Dieses Prinzip ist beim Entwerfen von VUIs sehr nützlich. Um Ihre Sprach-App-Entwicklung zur besten auf dem Markt zu machen, müssen Sie es Ihrem Sprachassistenten leicht machen, Befehle zu verstehen. Angenommen, Sie entwerfen eine Sprachinteraktion zum Starten einer Fertigungsmaschine. Der einfachste Weg wäre, diesen mehreren Maschinen Nummern zuzuweisen und dann Befehle wie „ Maschine 1 starten “ usw. zu geben.

  • Lassen Sie die Benutzer wissen, dass sie gehört werden

Denken Sie daran, wie aufgewühlt Sie sich fühlen, wenn auf einer Webseite, die Sie gerade geöffnet haben, kein Aktivitätszeichen angezeigt wird. Nun multiplizieren Sie diese Frustration im Fall von VUI.

Google Voice Assistant

Es ist sehr wichtig, im Auge zu behalten, dass Ihr Benutzer informiert werden muss, wenn das Gerät aktiv interagiert. Sie müssen den Benutzern Warteschlangen geben, wann sie sprechen und wann der Sprachassistent zuhört. Ein Bild oben von Google Assistant zeigt, wie es diese Funktion darstellt (mit Punkten, die eine Welle bilden) und mit Alexa, wie unten gezeigt (blaues Licht, das um den oberen Rand des Geräts wirbelt).

  • Bestätigen Sie, wenn die Aufgabe erledigt ist

Genauso wie Sie eine Bestätigung benötigen, nachdem Sie eine Transaktion durchgeführt haben, ist dasselbe bei einer VUI erforderlich. Woher weiß der Benutzer sonst, dass die Aufgabe ausgeführt wurde?

alexa

Wenn der Benutzer beispielsweise den Befehl „ Küchenlicht ausschalten “ gibt, muss Ihr Assistent mit etwas wie „Küchenlicht aus “ antworten . Dadurch entfällt die Notwendigkeit für den Benutzer, die erledigte Aufgabe persönlich zu überprüfen, was im Wesentlichen der springende Punkt bei einer sprachbasierten KI ist.

(Zusätzliche Lektüre: UI-Designtipps und -trends für mobile Apps, die 2020 folgen sollen {Exklusiv} )

Herausforderungen beim Entwerfen von VUI

Wie alles andere leidet auch das sprachbasierte Interface an der Achillesferse . Tatsächlich gibt es nicht einen, sondern viele. Was sind also die Herausforderungen, auf die VUI-Designer oft stoßen und die sie meistens nicht erkennen oder lösen?

  • Privatsphäre und Sicherheit

Die Tatsache, dass diese sprachbasierten KI-Assistenten immer auf Warteschlangen warten und den Geräuschen ihrer Umgebung lauschen, bereitet den Benutzern große Sorgen. Die Paranoia, dass ihre Privatsphäre manipuliert wird, ist auch nicht irrational.

Anfänglich speicherten Sprachassistenten wie Alexa alle Gespräche, auf die sie stießen, was in den Augen der Benutzer ein großes Risiko für Sprach-KI darstellt . Einem Paar passierte so etwas wie ein Albtraum, als Alexa dabei erwischt wurde, wie sie ihre geheimen Aufnahmen an einen Fremden schickte. Jetzt löschen einige Assistenten die gespeicherten Konversationen automatisch alle 24 Stunden oder so. Diese sind jedoch mit zusätzlichen Kosten und UI-Reibungen verbunden.

  • Vermitteln, was Sprachassistenten nicht leisten können

Für Voice-UI- und UX-Designer wird es schwierig, den Endbenutzern zu erklären, was die Voice AI nicht kann. Wenn Sie beispielsweise Google Assistant verwenden, wenn Sie sagen: „ Machen Sie ein Ereignis mit dem Namen Vertriebsteam-Besprechung für Dienstag um 14 Uhr “, erstellt es sofort eine Ereigniskarte und fragt später: „ Möchten Sie dieses Ereignis speichern?

Aber was ist, wenn Sie den Ort oder die Uhrzeit des Meetings später ändern müssen, was dann? Es würde antworten: „ Ich bin mir nicht sicher, was Sie gesagt haben, möchten Sie, dass ich dieses Ereignis speichere? “. Um die schlechte Benutzererfahrung zu vermeiden, könnte die KI einfach sagen „ Entschuldigung, ich arbeite immer noch daran, Standorte hinzuzufügen “.

  • Schwierigkeiten beim Prototyping und Testen

Eine weitere Herausforderung für die Designer ist das Prototyping und Testen von Sprach-UI. Angenommen, Sie haben einen Prototyp erstellt und möchten ihn testen. Sie haben die erste Aufforderung gegeben, dass Benutzer mit Ihrem Sprachassistenten Lebensmittel einkaufen können.

Die Herausforderung beginnt hier – Benutzer können eine bestimmte Sache in verschiedenen Stilen sagen, etwas, das schwer zu verfolgen ist. Umso schwieriger wird es, den Prototypen auf solche Anfragen zu testen, wenn er noch nicht vollständig mit der Sprachsuchtechnologie ausgereift ist .

  • Unterstützung der Sprache

Da der Hauptgrundsatz der Sprachtechnologie die Sprache ist, wird es für jede sprachbasierte KI entscheidend , sowohl fließend zu verstehen als auch zu sprechen. Leider hat sich die Technologie bisher nur in Bezug auf wenige Sprachen entwickelt. Dennoch ist das Hinzufügen anderer Sprachen und deutlicher Akzente zur Benutzeroberfläche noch in Arbeit.

Zukunft von VUI

Wie bei einem Ritual sind wir verpflichtet, die Zukunftsaussichten jeder Technologie zu betrachten, und Stimme ist nicht anders. Aus dem, was wir aus Anwendungsfällen von Sprachschnittstellen wie Alexa gesammelt haben, wissen wir, dass die Sprachtechnologie-Integration allein die täglichen Anforderungen der Benutzer nicht erfüllen kann.

Quote3 (2)

Der beste Weg, um es vollständig zu übernehmen, ist das Händeschütteln mit der visuellen Benutzeroberfläche – genau wie Google Assistant und Siri. VUI und visuelle Benutzeroberfläche können zusammen die Mängel der anderen ausgleichen und den Benutzern ein erstaunliches Sprachassistentenerlebnis bieten . Darüber hinaus können sie komplexe Aufgaben mit einfachen Sprachbefehlen erledigen, was Sprachschnittstellen an diesem Punkt ihrer Entwicklung fehlt.

Und wer weiß, wenn dieses Jahrzehnt endet, haben wir vielleicht alle unsere Jarvis und könnten alles wie Tony Stark ohne physische Anzeige machen.

Schlussbemerkung

VUIs sind hier, um zu bleiben und werden in Zukunft in immer mehr Produkte integriert. Wir hoffen, dass unser Blog hilfreich war, um all Ihre Zweifel bezüglich der Gestaltung von Sprachbenutzerschnittstellen auszuräumen. Falls Sie jedoch noch Fragen haben oder mehr über VUI erfahren möchten, können Sie sich mit unserem Team in Verbindung setzen und unsere Experten helfen Ihnen gerne mit innovativen Lösungen.