Клонирование голоса при помощи нейросистем – сомнительный рабочий инструмент

Человек, Технологии, Гаджеты и электроника

2021-10-1 23:46:00

3668

Клонирование голоса при помощи нейросистем – сомнительный рабочий инструмент

Развитие современных технологий во многом опережает своё время. Для огромного количества разработок ещё не существует законов, регулирующих их использование, а законодательные органы не могут их сформулировать, поскольку им не на что опереться. Самые известные и противоречивые из таких явлений – искусственный интеллект и создаваемые им DeepFake видео и фото. Теперь же сюда можно добавить и поддельный клонированный голос.

Проблема ИИ

Искусственный интеллект смог решить множество проблем благодаря способности осуществлять масштабные вычисления, недоступные обычным системам. С его помощью можно фотографию преобразовать в видео, а у видеозаписи увеличить размер кадра без потери качества. Тем не менее у подобных способностей оказалась и оборотная сторона: просчитывая кадр за кадром, искусственный интеллект может заменить в видеозаписи лицо человека, или же создать вполне правдоподобную фотографию, подлинность которой невозможно будет оспорить. Всё это создаёт немало трудностей и делает людей беззащитными перед мошенниками, а запретить эту технологию попросту невозможно. Впрочем, и в других сферах дела обстоят не лучше. Уже появились вполне обоснованные опасения, что системы искусственного интеллекта, задействованные в коммерческих структурах, могут использовать выгодные им алгоритмы, ущемляющие интересы человека.

На этом фоне, пока человек пытается найти способы ограничить собственное детище и заставить его работать по своим правилам, разработчики создали новую не менее вредоносную технологию – клонирование голоса. Поднимая трубку телефона, теперь уже нельзя быть уверенным в том, кто именно осуществляет звонок.

Голос как инструмент

Ещё в 2014 году была основана компания, занимавшаяся созданием искусственных голосов для тех, кто утратил способность говорить и вынужден пользоваться голосовыми помощниками. При помощи уже имевшихся технологий можно было создать синтезированный голос, который тембром и звучанием напоминал бы голос конкретного человека. С появлением же систем искусственного интеллекта возможности подобного метода выросли многократно. Система, прошедшая соответствующее обучение, может не просто создать похожий машинный голос, а полностью скопировать человеческую речь.

Проанализировав запись голоса конкретного человека, ИИ воссоздаёт не только характеристики звуковых колебаний, но и полностью манеру речи. Сюда входят особенности произношения определённых слов, речевых оборотов, отдельных звуков и даже специфику речи, зависящую от эмоций. Используя полученные данные, искусственный интеллект может со 100% точностью даже не воспроизводить, а говорить голосом конкретного человека. Некоторыми специалистами эта технология уже успешно используется. Она активно развивается и очень скоро станет настолько же распространённой, как и DeepFake. Для одних возможность синтезировать идеально похожую речь станет отличным рабочим инструментом, а для других – головной болью.

клонирование голоса

Клонирование голоса при помощи нейросистем – сомнительный рабочий инструмент

Проблема ИИ

Голос как инструмент

Поделиться статьей