Новости

RSS-трансляция Читать в ВКонтакте Читать в Одноклассниках Наш канал в Яндекс Дзен




21.12.2023 23:56
4021
В Китае отец «оживил» своего мертвого сына в цифровом формате

Технология глубокого обучения, используемая в новых наушниках, может помочь отфильтровать нежелательные фоновые шумы, сохранив при этом те звуки, которые нравятся человеку.

Может ли искусственный интеллект (ИИ) помочь фильтровать шум плач детей или вой сирен, сохраняя при этом пение птиц? Команда из Вашингтонского университета сообщила, что они знают, как можно отключаться от фоновых шумов по своему желанию.

Они разработали алгоритмы с использованием технологии глубокого обучения, которые позволяют пользователям выбирать звуки, которые они могут слышать, когда надевают наушники. Они назвали эту систему «семантическим слухом».

«На высоком уровне мы используем наушники с шумоподавлением для подавления всех звуков в окружающей среде. Но мы используем нейронную сеть на смартфоне, чтобы извлечь интересующие звуки и в режиме реального времени воспроизвести их обратно в ухо через наушники. ", - рассказал Шьям Голлакота, профессор компьютерных наук и инженерии.

Итак, как это работает? Наушники отправляют записанные звуки на подключенный смартфон, блокируя другие шумы. Пользователи могут выбирать звуки из 20 категорий (например, щебетание птиц) с помощью голосовых команд или приложения, при этом воспроизводятся только выбранные звуки.

«Целевые звуки, которые мы воспроизводим через динамики, должны соответствовать тому, что пользователь видит в окружающей среде. По этой причине у нас есть только 20 миллисекунд для обработки входного звука, извлечения целевых звуков и воспроизведения их в наушниках». — сказал Бандхав Велури, аспирант компьютерных наук, объяснив, что им нужно было создать «очень эффективную модель глубокого обучения».

«Что здесь интересно, так это то, что когда люди в наши дни обычно говорят о нейронных сетях и искусственном интеллекте, они знакомы с большими языковыми моделями, такими как ChatGPT», — сказал Голлакота. - Для этого требуются очень большие модели, которые работают в огромных центрах обработки данных, что на самом деле невозможно для нашего приложения. Мы разработали специальную нейронную сеть, которая может работать на смартфоне».

Протестированная в таких местах, как офисы, улицы и парки, система может различать сирены, звуки птиц, сигналы тревоги и специфические шумы, избавляясь при этом от всех других фоновых звуков.

Согласно результатам исследования, когда 22 человека высказали мнение о выводе звука системы, они в целом сказали, что он звучит лучше, чем оригинальная запись .

Однако в некоторых ситуациях системе было трудно отличить очень похожие звуки, например, пение и разговор. Исследователи предполагают, что обучение моделей на большем количестве реальных данных может помочь улучшить эти результаты.

«Система «созрела для вывода на потребительский рынок», - сказал Велури.

Понравилась эта новость? Подпишись на нас в соцсетях!


Смотрите ещё