На сегодняшний день голосовые ассистенты довольно неплохо распознают речь. Но есть одна проблема: как правило, помощники работают хорошо до тех пор, пока они слышат более или менее «правильную» речь. Стоит с ними заговорить с акцентом или же просто невнятно, и от «ума» ассистента не останется и следа. Однако же исследователи лаборатории Google AI, работающие совместно с учеными из Института по изучению бокового амиотрофического склероза (болезни, от которой страдал известный физик Стивен Хокиг), разработали ИИ-систему, которая может распознавать произношение людей с нарушениями речи или акцентом.
Зачем улучшать голосовых ассистентов?
Исследователи из Google говорят, что их подход поможет улучшить автоматическое распознавание речи, да и в целом их технологию можно без труда интегрировать в практически любую существующую систему по распознаванию голоса. Люди с боковым амиотрофическим склерозом часто имеют невнятную речь, но существующие системы ИИ обычно обучаются на голосовых данных от тех, кто говорит без каких-либо затруднений. Новый подход позволит значительно улучшить работу подобных алгоритмов. При этом голосовые ассистенты смогут куда лучше распознавать в принципе любую невнятную речь.
Сама система носит название Project Euphonia и для того, чтобы ее обучить, эксперты использовали более 36 часов голосовых аудиозаписей, полученных от 67 человек, страдающих боковым амиотрофическим склерозом. В результате после обучения, Project Euphonia сумел гораздо эффективнее распознавать речь. Если говорить о невнятной речи, то процент узнавания вырос на 62%, а вот в случае с акцентом данные куда скромнее — алгоритм справился «всего» на 35% лучше стандартных программ для распознавания голоса.
Это интересно: Как запретить голосовым ассистентам подслушивать вас.
Стоит заметить, что все тестирование проходило на английском языке, но алгоритм, по словам создателей, легко можно интегрировать и в другие голосовые пакеты. К тому же, сейчас Project Euphonia находится лишь на начальном этапе разработки и нельзя исключать улучшения показателей в будущем. О новейших разработках в этой сфере мы обязательно сообщим вам в нашем новостном Телеграм-канале. Так что рекомендуем подписаться.
Более того, Project Euphonia, наряду с другими похожими проектами Google, нацелен на то, чтобы в ближайшее время сделать Google Ассистент доступным для людей с ограниченными возможностями, поэтому сильно «затягивать» с разработкой поисковый гигант не намерен. Среди других интересных особенностей, которые может получить в будущем голосовой ассистент от Google, числятся Live Relay, функция, которая облегчает телефонные звонки для слабослышащих людей, а также Project Diva, нацеленный на введение функций для невербального общения.