Poradnik dotyczący bezbłędnego projektowania interfejsu głosowego użytkownika

Opublikowany: 2020-02-10

Odkąd zobaczyłem pierwszą część Iron Mana, byłem zafascynowany potencjałem technologii sztucznej inteligencji Tony'ego, aż za dobrze z jego asystentem AI Jarvisem.

Ale hej! Jesteśmy już w połowie drogi nie w rolce, ale w prawdziwym życiu.

Pamiętasz, jak po raz pierwszy używasz Siri na iPhonie 4S? To było nieziemskie uczucie, prawda? I od tego czasu wszyscy wiemy, jak daleko zaszliśmy – Alexa , Asystent Google , Cortona i setki innych.

Tak więc, jako zainspirowany projektant, jeśli jesteś tak samo zafascynowany jak ja i chcesz dać szansę sztucznej inteligencji opartej na głosie, musisz doskonalić swoje umiejętności i wiedzę na temat projektowania głosowych interfejsów użytkownika .

Na szczęście trafiłeś na właściwy artykuł. Oto wszystko, co chcesz i musisz wiedzieć o VUI oraz o tym, co sprawia, że ​​są one ważną częścią intuicyjnego projektowania wyszukiwania aplikacji.

Co to jest VUI (głosowy interfejs użytkownika)?

Skrót od Voice User Interface, VUI to interfejs, który umożliwia użytkownikom interakcję z systemem za pomocą poleceń głosowych. Najpopularniejsze i najlepsze przykłady interfejsu użytkownika głosowego to Asystent Google, Siri i Alexa firmy Amazon.

Największą zaletą VUI jest to, że ułatwiają one interakcję z systemem bez użycia wzroku i rąk.

Podobnie jak aplikacje mobilne działające na dowolnym systemie operacyjnym i urządzeniu, VUI zawiera trzy warstwy, które muszą ze sobą współpracować, aby zapewnić wydajne interakcje głosowe. Tutaj każda z trzech warstw wykorzystuje warstwę znajdującą się pod nią, jednocześnie wspierając warstwę powyżej. To dwie górne warstwy, w których znajduje się interfejs głosowy, znajdujące się w chmurze, a nie na urządzeniu.

interaction layers of VUI

Etapy projektowania głosowego interfejsu użytkownika

1. Zbadaj swoją publiczność

W tym procesie projektowania VUI musisz zastosować projektowanie zorientowane na użytkownika, tak jak przy projektowaniu innych produktów cyfrowych. Głównym celem jest tutaj zebranie informacji i zrozumienie zachowań i potrzeb użytkowników, ponieważ te informacje stanowią podstawę wymagań produktu.

To, na czym powinieneś się skupić na tym etapie, to:

  • Zidentyfikuj problemy użytkowników i ich doświadczenia. Dzięki temu będziesz mógł przeanalizować, gdzie użytkownicy mogą skorzystać.
  • Musisz zebrać informacje na temat języka użytkownika – tego, jak mówi i zwrotów, których używa podczas mówienia. Pomoże Ci to zaprojektować system dla różnych wypowiedzi.

2 . Definiować

Na tym etapie musisz zdefiniować możliwości i ukształtować produkt. To zawiera -

  • Tworzenie kluczowych scenariuszy interakcji

Scenariusze te pojawiają się przed konkretnymi pomysłami aplikacji i należy je zidentyfikować w celu przekształcenia w przepływ dialogu konwersacyjnego. Są sposobem na zastanowienie się, dlaczego ktoś musiałby korzystać z VUI. Musisz więc zaprojektować scenariusze, które będą miały wysoką wartość dla Twoich użytkowników.

Czasami może być mylące, które scenariusze są ważne, a które można zignorować. W tym celu możesz użyć macierzy przypadków użycia do oceny każdego z nich.

matrix of Voice Interaction cases

  • Upewnij się, że te scenariusze działają z głosem

Najważniejsze jest tutaj to, że użytkownicy są w stanie rozwiązać konkretny problem skuteczniej, niż byliby w stanie z alternatywami. Celem tego kroku jest znalezienie typowych i konkretnych przypadków, z których skorzystają użytkownicy.

Wśród wielu, kilka przypadków to – A. kiedy użytkownicy są zajęci i nie mogą korzystać z wizualnego interfejsu użytkownika oraz B. kiedy chcą coś zrobić szybko. Oznacza to, że polecenie VUI „ Odtwórz trochę muzyki ” jest znacznie mniej czasochłonne niż robienie tego ręcznie.

  • Trzy czynniki – intencja, wypowiedź, szczelina

Rozumiemy te dwie rzeczy na powyższym przykładzie „ Odtwórz jakąś muzykę ”.

Intencja – zasadniczo przedstawia szerszy cel polecenia głosowego. Istnieją dwa rodzaje intencji – A. Wysoka użyteczność (bardzo konkretne i proste polecenie, np. „włącz światło w salonie)” i B. Niska użyteczność (mętna i trudna do rozszyfrowania). W naszym przypadku jest to interakcja o wysokiej użyteczności.
Wypowiedź — dotyczy możliwych sposobów, w jakie użytkownicy mogą sformułować żądanie. W naszym przypadku alternatywą dla „ Odtwórz jakąś muzykę ” może być cokolwiek od „ Chcę posłuchać muzyki ” do „ Czy możesz odtworzyć utwór ” i tak dalej. Wszyscy projektanci UI/UX VUI muszą wziąć pod uwagę różnice.

Automaty – gdy intencja nie jest wystarczająca, automaty do gry wchodzą do akcji. Odnoszą się do dodatkowych informacji potrzebnych do dostarczenia najlepszych wyników zapytania. Mogą być opcjonalne i wymagane. W naszym przykładzie slot jest „odprężający”, ale jest opcjonalny, ponieważ kategoria muzyki nie jest zdefiniowana przez użytkownika. Jeśli jednak polecenie brzmiało „ zarezerwuj taksówkę na Uber ”, slot byłby „miejscem docelowym”, dlatego wymagany.

3. Stwórz prototyp

Przepływ dialogu jest odpowiedzią na pytanie „jak stworzyć interakcję głosową między użytkownikiem a technologią” . Proces rozpoczyna się od utworzenia przepływu dialogu dla każdego wymagania, do którego chcesz dotrzeć ze swoim produktem.

Oto punkty, które powinien obejmować przepływ dialogu – Główne słowa kluczowe dla interakcji, prawdopodobne gałęzie, do których może zmierzać rozmowa oraz przykładowe dialogi dla użytkowników i asystentów.

Przepływ dialogu w naszym przypadku to nic innego jak prototyp ilustrujący rozmowy w obie strony pomiędzy użytkownikami a asystentami głosowymi. Spójrzmy na ilustrowany przepływ dialogów poniżej, aby lepiej zrozumieć.

voice interaction between user and technology flowchart

Możesz użyć kilku narzędzi do prototypowania, które masz do dyspozycji dla VUI. Niektóre z najpopularniejszych to Amazon Alexa Skill Builder, Sayspring i Google SDK.

Pisanie dialogów

Skompilowany zestaw dialogów jest tym, co sprawia, że ​​elementy składowe głosowego użytkownika przepływają. Oto kilka wskazówek dotyczących tworzenia angażującego i konwersacyjnego dialogu –

  • Nie rób tego żmudnie długo. Ogranicz liczbę kroków do minimum.
  • Nie należy uczyć użytkowników poleceń. To jest coś naturalnego. Zamiast tego skup się na tym, aby Twój asystent głosowy był konwersacyjny.
  • Staraj się, aby Twoje pytania i odpowiedzi były krótkie. Oto nakazy i zakazy.

Nie –

Użytkownik: „Powiedz mi dobre miejsce do jedzenia chińskiej kuchni”
System: „Znalazłem dla Ciebie pięć miejsc. Pierwsza z nich to „Jedz po chińsku” znajduje się… 15 minut od ciebie, otwarta od 8:00 do 20:00, druga to „Pałeczki”, która znajduje się w…, 1 godzinę od ciebie,…”

Robić -
Użytkownik: „Powiedz mi dobre miejsce do jedzenia chińskiej kuchni”
System: „W okolicy jest kilka chińskich restauracji — wolisz chodzić czy jechać samochodem?”

Zidentyfikuj błędy

Czy nie lepiej zidentyfikować prawdopodobne błędy, które możesz popełnić podczas tworzenia dialogów, niż później naprawiać powiększony bałagan? Oto kilka rzeczy, od których zdecydowanie powinieneś trzymać się z daleka, ale zawsze trzymaj je z perspektywy, aby uniknąć stanów błędów.

  • Niejednoznaczność — słowa są z natury niejednoznaczne. Oznacza to, że jeśli osoba mówi „Dobra” , może to oznaczać „W porządku” lub symbolizować, że słucha. Dlatego uświadom swojej sztucznej inteligencji wszystkie powszechnie występujące niejasności, aby uzyskać optymalną wydajność.

  • Błędy pisowni/błędna wymowa – w przeciwieństwie do papieru słowa są wypowiadane inaczej. Jedno słowo może mieć wiele wymowy, co może utrudnić przepływ konwersacji między użytkownikiem a systemem przetwarzania języka naturalnego.

  • Brak odpowiednich opcji — zawsze upewnij się, że użytkownicy otrzymują z rozmowy coś wartościowego i istotnego. Nietrafne wyniki zapytania są najmniej atrakcyjne i jeszcze mniej motywują użytkowników do ponownego skorzystania z Twojego produktu.

Nawet jeśli zapytanie nie przyniesie pozytywnego wyniku, Twój asystent powinien zawsze odpowiedzieć i nie pozostawiać użytkowników zawieszonych. Oznacza to, że jeśli użytkownik poprosi o „ Zarezerwuj lot do Los Angeles z Dallas na wtorek ”, powinno następować – „ Nie mogłem znaleźć żadnych lotów na wtorek ”. A co jeszcze lepsze – „ Nie udało mi się znaleźć żadnych lotów na wtorek. Mam sprawdzić na środę? ”.

Przedstaw tożsamość swojej marki

Nawet w rozmowach międzyludzkich ton głosu ma duże znaczenie, ponieważ ma przypisaną mu wartość emocjonalną. Wtedy to Twoje dialogi staną się osobowością Twojego produktu i zawsze powinny wywrzeć pozytywne wrażenie w świadomości użytkowników. Trzeba tworzyć nie „tylko dialogi”, ale takie, które zaspokajają potrzeby emocjonalne użytkowników.

voice emotion

Użyj istniejącej zawartości

Jeśli wykorzystasz dane, którymi dysponujesz (wszystkie rozmowy, które Twój produkt prowadzi z użytkownikiem), możesz w dużym stopniu spersonalizować jego doświadczenie. Na przykład, jeśli użytkownik wyda polecenie „ Chcę zamówić makaron ”, system powinien powrócić do poprzedniego stanu: „ Czy chcesz powtórzyć ostatnie zamówienie makaronu Hakka z Chopstick?

4. Przetestuj swój produkt

Po tym, jak wszystko zbliża się do końca, nadszedł czas, aby przetestować nasiona twojej pracy. Musisz przetestować zaprojektowany VUI, aby upewnić się, że spełnia wszystkie kryteria z listy kontrolnej. Istnieją dwa sposoby testowania prototypu.

  • Z docelowymi użytkownikami

Możesz tworzyć grupy docelowych odbiorców, a następnie wdrażać sesje testowe, aby obserwować, jak użytkownicy wchodzą w interakcję z Twoim produktem. Możesz wykorzystać tę okazję do śledzenia wskaźnika wykonania zadań i wyniku zadowolenia klienta (CSAT).

  • Z symulatorami testowymi

Podobnie jak inne symulatory wykorzystywane w tworzeniu aplikacji mobilnych, Google i Amazon również udostępniają narzędzia do testowania zaprojektowanego produktu. Możesz przetestować Alexa Skill i Google Action produktu w odniesieniu do urządzeń sprzętowych i ich ustawień.

5. Udoskonal

Gdy Twoja aplikacja trafi na rynek, nadszedł czas na obserwację. Czas oddać się analityce UX. Ten etap dotyczy analizy, w jaki sposób użytkownicy korzystają z Twojego produktu. Jeśli nie masz pojęcia, jakie metryki powinieneś obserwować, może to być bardzo trudne. Oto najważniejsze z nich.

  • Sesje na użytkownika lub wiadomości na sesję
  • Używane języki
  • Intencje i wypowiedzi
  • Wskaźniki zaangażowania użytkowników
  • Przepływy zachowań

Wytyczne projektowe dla głosowego interfejsu użytkownika

„Słowa są źródłem nieporozumień” – Antoine de Saint-Exupery

Zwykle wizualne interfejsy użytkownika również mają problemy, które należy rozwiązać, ale frustracja spowodowana wadliwym interfejsem wizualnym jest niczym w porównaniu z VUI. Tak więc, jeśli zaprojektowany asystent głosowy nie działa dobrze, zostanie porzucony jak gorący ziemniak.

(Możesz również przeczytać nasz artykuł na temat wizualnego opowiadania historii w zakresie projektowania interfejsu użytkownika/UX aplikacji )

Wiesz, co pomoże ci temu zapobiec? Wytyczne projektowe VUI . Więc spójrzmy na nie od razu.

  • Nie czekaj, aż użytkownicy najpierw zapytają

W przeciwieństwie do wizualnego interfejsu użytkownika użytkownicy mogą nie być w stanie od razu zapoznać się z funkcjami. Mogą nawet nie wiedzieć, jak zacząć. W takim przypadku jedną z najlepszych praktyk Voice UI jest zrobienie pierwszego kroku. Na przykład, jeśli masz mobilną aplikację pogodową z obsługą głosową , może ona powiedzieć użytkownikom: „ Możesz poprosić o dzisiejszą pogodę lub prognozę tygodniową. ” Dodatkowo powinieneś również zaoferować opcję łatwego wyjścia.

  • Utrzymuj krótką listę opcji działania

Tip

Dopóki i o ile nie chcesz przytłoczyć swojego użytkownika od samego początku, musisz upewnić się, że dostarczasz tylko najbardziej odpowiednie i podstawowe opcje.

Treść słowna musi być jak najbardziej zwięzła i pełna znaczenia, a jednocześnie łatwa do zrozumienia za jednym razem. Zgodnie z zaleceniami firmy Amazon przy projektowaniu interfejsów użytkownika Voice dla aplikacji mobilnych dla Alexy, nie należy wymieniać więcej niż trzech opcji interakcji. Dzięki temu zapewnisz również wciągający projekt UX VUI.

  • KISS – zachowaj prostotę i zwięzłość

Ta zasada jest bardzo przydatna przy projektowaniu VUI. Aby tworzenie aplikacji głosowych było jak najlepsze, musisz ułatwić asystentowi głosowemu rozumienie poleceń. Załóżmy, że projektujesz interakcję głosową, aby uruchomić maszynę warsztatową, najprostszym sposobem byłoby przypisanie tym wielu maszynom numerów, a następnie wydawanie poleceń, takich jak „ Uruchom maszynę 1 ” itp.

  • Poinformuj użytkowników, że są słyszani

Pamiętaj, jak bardzo jesteś poruszony, gdy na właśnie otwartej stronie internetowej nie ma oznak aktywności. Teraz pomnóż tę frustrację w przypadku VUI.

Google Voice Assistant

Bardzo ważne jest, aby zachować perspektywę, że użytkownik musi być informowany, gdy urządzenie aktywnie wchodzi w interakcję. Musisz ustawić użytkownikom kolejki, kiedy mają mówić, a kiedy nasłuchuje asystent głosowy. Powyższy obraz Asystenta Google pokazuje, jak reprezentuje tę funkcję (z kropkami tworzącymi falę) i z Alexą, jak pokazano poniżej (niebieskawe światło wirujące wokół górnej krawędzi urządzenia).

  • Potwierdź zakończenie zadania

Tak jak potrzebujesz potwierdzenia po dokonaniu jakiejkolwiek transakcji, to samo jest potrzebne z VUI. W przeciwnym razie, skąd użytkownik wiedziałby, że zadanie zostało wykonane?

alexa

Na przykład, gdy użytkownik wyda polecenie „ wyłącz światła w kuchni ”, asystent musi odpowiedzieć czymś w rodzaju „Wyłączone światła w kuchni” . Wyeliminuje to potrzebę sprawdzania przez użytkownika zadania wykonanego osobiście, co jest zasadniczo całym celem posiadania sztucznej inteligencji opartej na głosie.

(Dodatkowa lektura: Wskazówki i trendy dotyczące projektowania interfejsu użytkownika aplikacji mobilnych w 2020 r. {Exclusive} )

Wyzwania projektowania VUI

Jak wszystko inne, interfejs głosowy również cierpi na piętę achillesową . W rzeczywistości jest nie jeden, ale wiele. Więc jakie są wyzwania, z którymi często spotykają się projektanci VUI i najczęściej nie potrafią rozpoznać lub rozwiązać?

  • Prywatność i ochrona

Fakt, że ci głosowi asystenci AI zawsze czekają na kolejki, słuchając dźwięków otoczenia, stanowi duży problem dla użytkowników. Paranoja ingerencji w ich prywatność również nie jest irracjonalna.

Początkowo asystenci głosowi, tacy jak Alexa, przechowywali wszystkie napotkane rozmowy, co stanowi duże ryzyko głosowej sztucznej inteligencji w oczach użytkowników. Coś koszmarnego przydarzyło się parze, gdy Alexa została przyłapana na wysyłaniu swoich tajnych nagrań do nieznajomej osoby. Teraz niektórzy asystenci automatycznie usuwają zapisane rozmowy co około 24 godziny. Jednak wiążą się one z dodatkowymi kosztami i tarciem w interfejsie użytkownika.

  • Przekaż to, czego asystenci głosowi nie mogą wykonać

Wytłumaczenie użytkownikom końcowym, czego Voice AI nie może zrobić, staje się wyzwaniem dla projektantów Voice UI i UX. Na przykład podczas korzystania z Asystenta Google, gdy mówisz „ Utwórz wydarzenie o nazwie Spotkanie zespołu sprzedaży we wtorek o godzinie 2 ”, natychmiast tworzy kartę wydarzenia i pyta później „ Czy chcesz zapisać to wydarzenie?

Ale co, jeśli później będziesz musiał zmienić miejsce lub godzinę spotkania, co wtedy? Odpowiedziałby „ Nie jestem pewien, co powiedziałeś, czy chcesz, żebym uratował to wydarzenie? ”. Aby uniknąć złych doświadczeń użytkownika, sztuczna inteligencja może po prostu powiedzieć „ przepraszam, wciąż pracuję nad dodawaniem lokalizacji ”.

  • Trudności w prototypowaniu i testowaniu

Kolejnym wyzwaniem stojącym przed projektantami jest prototypowanie i testowanie interfejsu głosowego. Załóżmy, że stworzyłeś prototyp i chcesz go przetestować. Dałeś wstępny komunikat, że użytkownicy mogą robić zakupy spożywcze za pomocą asystenta głosowego.

Wyzwanie zaczyna się tutaj – użytkownicy mogą powiedzieć konkretną rzecz w różnych stylach, co jest trudne do zapamiętania. Testowanie prototypu na takich zapytaniach staje się tym trudniejsze, gdy nie jest on jeszcze w pełni opracowany w technologii wyszukiwania głosowego .

  • Obsługa języka

Ponieważ główną zasadą technologii głosowej jest język, kluczowe znaczenie dla każdej sztucznej inteligencji opartej na głosie ma płynne rozumienie i mówienie. Niestety, jak dotąd technologia rozwinęła się tylko w odniesieniu do kilku języków. Niemniej jednak dodawanie innych języków i wyraźnych akcentów do interfejsu wciąż trwa.

Przyszłość VUI

Jak rytuał, jesteśmy zobowiązani do spojrzenia na przyszłe perspektywy każdej technologii i głosu nie różnią się od siebie. Z tego, co zebraliśmy na podstawie przypadków użycia interfejsu głosowego, takich jak Alexa, wiemy, że sama integracja technologii głosowej nie może spełnić codziennych wymagań użytkowników.

Quote3 (2)

Najlepszym sposobem, aby go całkowicie zaadoptować, jest uścisk dłoni z wizualnym interfejsem użytkownika – podobnie jak Asystent Google i Siri. VUI i wizualny interfejs użytkownika razem mogą zrównoważyć nawzajem niedociągnięcia, zapewniając użytkownikom niesamowite wrażenia z korzystania z asystenta głosowego . Dodatkowo pozwoli im to na wykonywanie skomplikowanych zadań za pomocą prostych poleceń głosowych, czego brakuje interfejsom głosowym na tym etapie ich rozwoju.

I kto wie, kiedy ta dekada dobiegnie końca, wszyscy możemy mieć swojego Jarvisa i moglibyśmy to wszystko zrobić jak Tony Stark bez fizycznego wyświetlacza.

Ostatnia uwaga

VUI nie znikną i będą w przyszłości integrowane z coraz większą liczbą produktów. Mamy nadzieję, że nasz blog był pomocny w rozwianiu wszelkich wątpliwości związanych z projektowaniem głosowych interfejsów użytkownika. Jeśli jednak nadal masz pytania lub chcesz dowiedzieć się więcej o VUI, możesz skontaktować się z naszym zespołem, a nasi eksperci chętnie pomogą Ci z innowacyjnymi rozwiązaniami.