Новости

RSS-трансляция Читать в ВКонтакте Читать в Одноклассниках Наш канал в Яндекс Дзен




14.10.2022 23:21
4832
Новая система голосового управления для смартфона может работать без слов

Хоть смартфон по-прежнему и называют мобильным телефоном, по своей сути он является настоящей витриной современных технологий. Количество его функций постоянно растёт, а для управления ими используют, в том числе и голосовой ввод. Правда, многие пользователи, попробовав голосовое управление, быстро от него отказываются из-за его несовершенства и некоторых неудобств. Поэтому учёные из Университета Буффало разработали способ управления голосом без голоса.

Без рук

Отказ от использования механических кнопок положил начало новому направлению в развитии смартфонов, а именно к увеличению доли дистанционного управления их функциями. Если уж нет необходимости больше жать на кнопки, то и к экрану прикасаться совершенно необязательно, по крайней мере, этот процесс можно свести к минимуму. Например, большой популярностью пользуется управление жестами, которое сильно экономит время и позволяет сходу вызывать наиболее востребованные функции без захода в меню. Более удобным способом должно было стать голосовое управление, когда интеллектуальная система распознаёт сказанные вслух команды и выполняет требуемые от неё действия.

Как показала практика, запуск конкретных функций при помощи голоса подходит далеко не всем, а для многих пользователей он откровенно неудобен. В любом случае существует множество ситуаций, когда разговор с собственным телефоном совсем неуместен. Например, в общественных местах, где от посетителей требуется соблюдать тишину, а в условиях сильного шума этой функцией пользоваться и вовсе не возможно. Некоторые новаторы предлагают решать эти проблемы совсем уж экзотическими способами, такими как кулон с камерой, подвешенный на шею. При этом направленная вверх камера фиксирует движения губ пользователя, распознаёт их и переводит в голосовые команды. Правда, для этого необходимы приличные вычислительные способности, а само устройство будет совсем не дешёвым.

Тем не менее подобные сложности не останавливают изобретателей, они продолжают придумывать всё новые способы, пытаясь заставить мобильные телефоны слушаться своих владельцев в самых разных условиях. Как считают специалисты Университета Буффало, можно совсем отказаться от использования звуковых колебаний, поскольку те легко заглушаются окружающим шумом и смешиваются с фоновыми звуками. В свою очередь это затрудняет распознавание речи и снижает точность выполнения команд. Исследователи решили, что человеку лучше всего говорить без слов.

Невербальное общение

Исследовательская группа пришла к выводу, что лучшим решением будет не использовать голос совсем. Для этого учёные обратились к изучению самого процесса речи, чтобы понимать всю её «механику». В своей работе они обратились к физиологии и к движениям мышц человека. Для того чтобы произнести хотя бы одно слово, человеку приходится задействовать многочисленные лицевые мышцы. При этом работа мышц во время артикуляции конкретного звука работа мышц характерна и каждый раз повторяется, поэтому можно отделить одно движение от другого и связать его с какой-нибудь буквой или словом.

Разумеется, учёные не смогли зафиксировать движения мышц, как таковых, им пришлось обратиться к внешним проявлениям. Они обратили внимание, что внутренняя часть уха, а конкретно, стенки слогового прохода, изгибаются во время речи. Проанализировав характер движений и связав их с тем, что при этом говорит человек, учёные смогли выделить соответствия между ними и произносимыми словами. Таким образом они создали новую, невербальную систему распознавания речи.

Данные о том, как именно движутся стенки ушного прохода, исследователи получили при помощи своеобразного эхолота. В ухо человека помещается динамик, который испускает неслышимый ультразвук. Звуковые колебания отражаются от стенок и возвращаются назад, где улавливаются при помощи микрофона. Все поступающие от него данные анализируются при помощи системы на основе искусственного интеллекта, она распознаёт произнесённые человеком слова и перенаправляет их на мобильный телефон. Человеку не требуется хоть что-то говорить вслух, вполне достаточно произнести команду беззвучно. Челюстно-лицевые мышцы при этом работают точно так же, как и во время обычного разговора.

Прибор собрали и протестировали его работу. Как показали результаты, новое устройство невербального управление отлично работает, хоть и может быть улучшено. Во время испытаний использовали 32 команды, состоящие из одного слова, а также 25 команд длиной в целое предложение. В первом случае количество ошибочных распознаний составило 12,3%, во втором – 10,2%. По мнению учёных, эти показатели можно улучшить, доработав технику и алгоритмы.

Понравилась эта новость? Подпишись на нас в соцсетях!