Голосовой интерфейс

Пересказ доклада Константина Самойлова «Голосовые интерфейсы и проектирование виртуальных ассистентов». Константин был исследователем пользовательского опыта в Google и занимался речевыми интерфейсами (система OK Google и голосовой поиск).

Доклад рассказан на UX-марафоне «Взаимодействие будущего» 6 июля 2017 года, когда голосового помощника «Яндекса» ещё не было.

Что это

Чтобы не было путаницы, важно договориться, что в принципе понимается под голосовым интерфейсом (ГИ).

Задача распознавания голоса активно решается. Его качество даже для не английского языка в неидеальных условиях (с акцентами и интонациями) составляет 95−98%. Если натренировать модель, качество можно повысить.

Кроме распознавания и генерации голоса есть 3 составляющих, о которых часто забывают. Без них голосовое взаимодействие с системой практически невозможно.

Читать далее Голосовой интерфейс