Практическое руководство по безупречному голосовому дизайну пользовательского интерфейса
Опубликовано: 2020-02-10С тех пор, как я увидел первую часть «Железного человека», я был очарован потенциалом технологии искусственного интеллекта, Тони и его помощником по искусственному интеллекту Джарвисом.
Но эй! Мы уже на полпути не в кино, а в реальной жизни.
Помните, как вы впервые использовали Siri на iPhone 4S? Это было потустороннее чувство, не так ли? И с тех пор мы все знаем, как далеко мы продвинулись — Alexa , Google Assistant , Cortona и еще сотня.
Итак, как вдохновленный дизайнер, если вы так же увлечены, как и я, и хотите дать шанс голосовому ИИ, вам нужно отточить свои навыки и знания о том, как проектировать голосовые пользовательские интерфейсы .
К счастью, вы наткнулись на нужную статью. Здесь есть все, что вам нужно знать о VUI и о том, что делает их важной частью интуитивно понятного дизайна поиска приложений.
Что такое VUI (голосовой пользовательский интерфейс)?
Акроним голосового пользовательского интерфейса, VUI — это интерфейс, который позволяет пользователям взаимодействовать с системой с помощью голосовых команд. Наиболее популярными примерами голосового пользовательского интерфейса являются Google Assistant, Siri и Amazon Alexa.
Самым большим преимуществом VUI является то, что они облегчают взаимодействие с системой без помощи глаз и рук.
Подобно мобильным приложениям, работающим в любой ОС и на любом устройстве, VUI содержит три уровня, которые должны работать вместе для эффективного голосового взаимодействия. Здесь каждый из трех слоев использует слой, который находится под ним, поддерживая при этом слой выше. Это два верхних уровня, на которых лежит голосовой интерфейс, находящийся в облаке, а не на устройстве.
Этапы проектирования голосового пользовательского интерфейса
1. Изучите свою аудиторию
В этом процессе разработки VUI вам необходимо использовать дизайн, ориентированный на пользователя, так же, как и при разработке других цифровых продуктов. Основная цель здесь — собрать информацию и понять поведение и потребности пользователей, поскольку эта информация составляет основу требований к продукту.
На этом этапе вы должны сосредоточиться на следующем:
- Определите болевые точки пользователей и их опыт. Таким образом, вы сможете проанализировать, где пользователи могут извлечь выгоду.
- Вы должны собрать информацию о языке пользователей — о том, как они разговаривают, и какие фразы они используют во время разговора. Это поможет вам разработать систему для различных высказываний.
2 . Определять
На этом этапе нужно определить возможности и сформировать продукт. Это включает в себя -
- Создание ключевых сценариев взаимодействия
Эти сценарии предшествуют конкретным идеям приложения и должны быть идентифицированы, чтобы превратиться в диалоговый поток. Это способ подумать о том, почему кому-то нужно использовать VUI. Итак, вам нужно разработать сценарии, имеющие высокую ценность для ваших пользователей.
Иногда может возникнуть путаница в отношении того, какие сценарии важны, а какие можно игнорировать. Для этой цели вы можете использовать матрицу вариантов использования для оценки каждого из них.
- Убедитесь, что эти сценарии работают с голосом
Самое главное здесь то, что пользователи могут решить конкретную проблему более эффективно, чем они могли бы с альтернативами. Цель этого шага — найти общие и конкретные случаи, которые будут полезны пользователям.
Среди многих, несколько случаев: A. когда пользователи заняты и не могут использовать визуальный пользовательский интерфейс, и B. когда они хотят что-то сделать быстро. Т.е. команда VUI « Воспроизвести музыку » занимает гораздо меньше времени, чем выполнение ее вручную.
- Три фактора: намерение, высказывание, слот
Давайте разберемся с этими двумя на вышеупомянутом примере « Включи музыку ».
Намерение — это в основном отображает более широкую цель голосовой команды. Есть два типа намерений: А. Высокая полезность (очень конкретная и прямая команда, т. е. «включи свет в гостиной») и Б. Низкая полезность (расплывчатая и трудно поддающаяся расшифровке). В нашем случае это взаимодействие с высокой полезностью.
Высказывание — это касается возможных способов, которыми пользователи могут сформулировать запрос. В нашем случае альтернативой « Включи музыку » может быть что угодно, от « Я хочу послушать музыку » до « можешь поставить песню » и так далее. Все UI/UX дизайнеры VUI должны принимать во внимание вариации.
Слоты . Когда намерения недостаточно, в действие вступают слоты. Они относятся к дополнительной информации, необходимой для получения наилучших результатов по запросу. Они могут быть необязательными и обязательными. В нашем примере слот «расслабляющий», но он необязателен, так как категория музыки не определяется пользователем. Однако, если бы команда была « заказать такси в Uber », слот был бы «пунктом назначения», следовательно, требуется.
3. Создайте прототип
Диалоговый поток — это ответ на вопрос «как создать голосовое взаимодействие между пользователем и техникой» . Процесс начинается с создания потока диалога для каждого требования, которое вы стремитесь выполнить в своем продукте.
Это следующие моменты, которые должен охватывать поток диалога: основные ключевые слова для взаимодействия, вероятные ответвления, в которые может пойти разговор, и примеры диалогов для пользователей и помощников.
Поток диалогов в нашем случае — не что иное, как прототип, иллюстрирующий переписку между пользователями и голосовыми помощниками. Давайте посмотрим на иллюстрированный диалог ниже для лучшего понимания.
Вы можете использовать несколько инструментов прототипирования для VUI. Одними из самых популярных являются Amazon Alexa Skill Builder, Sayspring и Google SDK.
Написание диалогов
Скомпилированный набор диалогов — это то, что делает строительные блоки голосового потока пользователя. Вот несколько советов по созданию увлекательного и разговорного диалога:
- Не делайте процесс утомительно долгим. Сведите количество шагов к минимуму.
- Не следует обучать пользователей командам. Это нечто естественное. Вместо этого сосредоточьтесь на том, чтобы сделать голосового помощника разговорным.
- Старайтесь, чтобы ваши вопросы и ответы были краткими. Вот что можно, а что нельзя.
Не -
Пользователь: «Подскажите хорошее место, где можно поесть китайской кухни»
Система: «Я нашла для тебя пять мест. Первый — «Ешь по-китайски» находится…, в 15 минутах от вас, работает с 8:00 до 20:00, второй — «Палочки для еды», который находится на…, в 1 часе от вас,…»
Делать -
Пользователь: «Подскажите хорошее место, где можно поесть китайской кухни»
Система: «В этом районе есть несколько китайских ресторанов — вы предпочитаете идти пешком или ехать на машине?»
Выявление ошибок
Не лучше ли определить вероятные ошибки, которые вы можете допустить при создании диалогов, чем потом исправлять раздутый беспорядок? Вот несколько вещей, от которых вам определенно следует держаться подальше, но всегда держите их в поле зрения, чтобы избежать ошибок.
- Неоднозначность – слова по своей природе неоднозначны. Это означает, что если человек говорит «Хорошо», это может означать «Хорошо» или символизировать, что он слушает. Итак, сделайте так, чтобы ваш ИИ знал обо всех часто встречающихся неоднозначностях для оптимальной работы.
- Орфографические ошибки/неправильное произношение – в отличие от бумаги, слова произносятся по-другому. Одно слово может иметь несколько вариантов произношения, что может затруднить диалог между пользователем и системой обработки естественного языка.
- Не предоставление релевантных вариантов . Всегда следите за тем, чтобы пользователи получали что-то ценное и актуальное из разговора. Нерелевантные результаты запроса наименее привлекательны и еще менее мотивируют пользователей снова использовать ваш продукт.
Даже если запрос не дает положительного результата, ваш помощник должен всегда отвечать и не оставлять пользователей без ответа. То есть, если пользователь запрашивает « Забронировать рейс в Лос-Анджелес из Далласа на вторник », следует следующее: « Я не смог найти ни одного рейса на вторник ». И что еще лучше — « Я не смог найти ни одного рейса на вторник. Хочешь, я проверю на среду? ».
Изобразите индивидуальность вашего бренда
Даже в человеческом общении тон голоса имеет большое значение, поскольку ему придается эмоциональная ценность. Затем ваши диалоги — это то, что станет индивидуальностью вашего продукта, и он всегда должен производить положительное впечатление в умах пользователей. Вам нужно создавать не «просто диалоги», а те, которые удовлетворяют эмоциональные потребности пользователей.
Используйте существующий контент
Если вы используете имеющиеся в вашем распоряжении данные (все разговоры вашего продукта с пользователем), вы можете значительно персонализировать их опыт. Например, если пользователь командует « Я хочу заказать лапшу », ваша система должна вернуть « Хотите повторить свой последний заказ лапши хакка из Chopstick? ”
4. Протестируйте свой продукт
После того, как все приблизилось к стадии завершения, пришло время проверить семена вашего труда. Вам необходимо протестировать разработанный вами VUI, чтобы убедиться, что он соответствует всем контрольным показателям из вашего контрольного списка. Есть два способа, которые вы можете использовать для тестирования вашего прототипа.

- С целевыми пользователями
Вы можете создавать группы целевой аудитории, а затем проводить сеансы тестирования, чтобы наблюдать, как пользователи взаимодействуют с вашим продуктом. Вы можете использовать эту возможность для отслеживания скорости выполнения задач и оценки удовлетворенности клиентов (CSAT).
- С тестовыми симуляторами
Как и другие симуляторы, используемые при разработке мобильных приложений, Google и Amazon также предоставляют инструменты для тестирования разработанного продукта. Вы можете протестировать Alexa Skill и Google Action продукта в отношении аппаратных устройств и их настроек.
5. Уточнить
После того, как ваше приложение появилось на рынке, настало время для наблюдения. Пришло время заняться UX-аналитикой. Этот этап посвящен анализу того, как пользователи используют ваш продукт. Это может быть очень сложно, если вы понятия не имеете о том, какие показатели вы должны наблюдать. Итак, вот самые известные из них.
- Сеансы на пользователя или сообщения на сеанс
- Используемые языки
- Намерения и высказывания
- Показатели вовлеченности пользователей
- Поведенческие потоки
Рекомендации по проектированию голосового пользовательского интерфейса
«Слова — источник недоразумений» — Антуан де Сент-Экзюпери
Обычно у визуальных пользовательских интерфейсов также есть проблемы, которые необходимо решать, но разочарование от неисправного визуального интерфейса ничто по сравнению с разочарованием от VUI. Так что, если ваш разработанный голосовой помощник не будет работать должным образом, его выбросят, как горячую картошку.
(Вы также можете прочитать нашу статью о визуальном сторителлинге для UI/UX дизайна приложений )
Знаете, что поможет вам предотвратить это? – Руководство по проектированию VUI . Итак, давайте посмотрим на них сразу.
Не ждите, пока пользователи спросят первыми
В отличие от визуального пользовательского интерфейса, пользователи могут не сразу ознакомиться с функциями. Они могут даже не знать, как начать. В этом случае одна из лучших практик голосового пользовательского интерфейса — сделать первый шаг. Например, если у вас есть мобильное приложение с голосовым управлением погодой , оно может сказать пользователям: « Вы можете запросить прогноз погоды на сегодня или на неделю. Кроме того, вы также должны предложить легкий вариант выхода.
Сократите список вариантов действий
До тех пор, пока вы не захотите перегрузить своего пользователя с самого начала, вам нужно убедиться, что вы предоставляете в первую очередь только самые подходящие и основные параметры.
Вербальное содержание должно быть максимально кратким и наполненным смыслом, но при этом простым для понимания с первого раза. В соответствии с рекомендациями Amazon по разработке голосовых пользовательских интерфейсов для мобильных приложений для Alexa нельзя перечислять более трех вариантов взаимодействия. Это также обеспечит привлекательный UX-дизайн VUI.
ПОЦЕЛУЙ – будь проще и короче
Этот принцип очень полезен при разработке VUI. Чтобы сделать разработку вашего голосового приложения лучшей из существующих, вам нужно сделать так, чтобы ваш голосовой помощник мог легко понимать команды. Предположим, вы разрабатываете голосовое взаимодействие для запуска машины в цеху. Самый простой способ — присвоить этим нескольким машинам номера, а затем дать такие команды, как « Запустить машину 1 » и т. д.
Сообщите пользователям, что их слышат
Вспомните, как вы взволнованы, когда на только что открытой веб-странице нет знака активности. Теперь умножьте это разочарование в случае VUI.
Очень важно иметь в виду, что ваш пользователь должен быть проинформирован, когда устройство активно взаимодействует. Вы должны поставить пользователей в очередь на то, когда говорить и когда голосовой помощник слушает. На изображении Google Assistant выше показано, как он представляет эту функцию (с точками, образующими волну), и с Alexa, как показано ниже (голубоватый свет, кружащийся вокруг верхнего края устройства).
Подтвердите, когда задача будет выполнена
Точно так же, как вам нужно подтверждение после совершения любой транзакции, то же самое необходимо и с VUI. Иначе как пользователь узнает, что задача была выполнена?
Например, когда пользователь дает команду « выключить свет на кухне », ваш помощник должен ответить что-то вроде «Кухонный свет выключен» . Это избавит пользователя от необходимости лично проверять выполненную задачу, что, по сути, является основным смыслом наличия ИИ на основе голоса.
(Дополнительное чтение: советы по дизайну пользовательского интерфейса мобильных приложений и тенденции, которым следует следовать в 2020 году {эксклюзив} )
Проблемы проектирования VUI
Как и все остальное, голосовой интерфейс тоже страдает ахиллесовой пятой . На самом деле их не один, а много. Итак, с какими проблемами часто сталкиваются дизайнеры VUI и чаще всего не могут распознать или решить?
Конфиденциальность и безопасность
Тот факт, что эти голосовые помощники ИИ всегда ждут своей очереди, слушая звуки окружающей среды, вызывает большую озабоченность у пользователей. Паранойя по поводу вторжения в их частную жизнь также не является иррациональной.
Первоначально голосовые помощники, такие как Alexa, сохраняли все разговоры, с которыми они сталкивались, что представляло большой риск для голосового ИИ в глазах пользователей. Что-то вроде кошмара случилось с парой, когда Алексу поймали на отправке их секретных записей незнакомцу. Теперь некоторые помощники автоматически удаляют сохраненные разговоры каждые 24 часа или около того. Однако это связано с дополнительными затратами и трениями с пользовательским интерфейсом.
Расскажите, чего не могут голосовые помощники
Дизайнерам голосового пользовательского интерфейса и UX становится сложно объяснить конечным пользователям, чего не может сделать голосовой ИИ. Например, при использовании Google Assistant, когда вы говорите « Создайте мероприятие под названием «Собрание отдела продаж во вторник в 2 часа », он мгновенно создает карточку события, а позже спрашивает: « Хотите ли вы сохранить это событие? ”
Но что делать, если вам нужно изменить место или время встречи позже, что тогда? Он ответит: « Я не уверен в том, что вы сказали, вы хотите, чтобы я сохранил это событие? ». Чтобы избежать неприятного пользовательского опыта, ИИ мог просто сказать « извините, я все еще работаю над добавлением локаций ».
Сложность прототипирования и тестирования
Еще одна проблема, с которой столкнулись дизайнеры, — прототипирование и тестирование голосового пользовательского интерфейса . Предположим, вы создали прототип и хотите его протестировать. Вы дали первоначальную подсказку, что пользователи могут покупать продукты с помощью вашего голосового помощника.
Проблема начинается здесь — пользователи могут говорить определенные вещи в разных стилях, что трудно отследить. Тем сложнее тестировать прототип на таких запросах, когда он еще не до конца проработан с технологией голосового поиска .
Поддержка языка
Поскольку основным принципом голосовой технологии является язык, для любого искусственного интеллекта на основе голоса становится крайне важным свободно понимать, а также говорить. К сожалению, пока технология развита только в отношении нескольких языков. Тем не менее, добавление других языков и различных акцентов в интерфейс все еще продолжается.
Будущее ВУИ
Как ритуал, мы обязаны смотреть на будущие перспективы каждой технологии, и голос ничем не отличается. Из того, что мы узнали из примеров использования голосового интерфейса , таких как Alexa, мы знаем, что одна только интеграция голосовых технологий не может удовлетворить повседневные потребности пользователей.
Лучший способ полностью принять его — пожать друг другу руки с помощью визуального пользовательского интерфейса — точно так же, как Google Assistant и Siri. VUI и визуальный пользовательский интерфейс вместе могут сбалансировать недостатки друг друга, предоставляя пользователям потрясающие возможности голосового помощника . Кроме того, это позволит им выполнять сложные задачи с помощью простых голосовых команд, чего не хватает голосовым интерфейсам на данном этапе их разработки.
И кто знает, к тому времени, когда это десятилетие закончится, у всех нас может быть свой Джарвис, и мы сможем делать все это, как Тони Старк, без физического дисплея.
Заключительное примечание
VUI никуда не денутся, и в будущем они будут интегрированы во все большее количество продуктов. Мы надеемся, что наш блог помог развеять все ваши сомнения относительно разработки голосовых пользовательских интерфейсов. Но если у вас все еще есть какие-либо вопросы или вы хотите узнать больше о VUI, вы можете связаться с нашей командой, и наши специалисты с радостью помогут вам с инновационными решениями.