29 марта компания OpenAI представила программное обеспечение Voice Engine, которое использует искусственный интеллект для создания голосов на основе коротких записей продолжительностью всего 15 секунд и способно читать текст. Он также может воспроизводить речь на иностранных языках, даже если в записях используется только английский язык.
Voice Engine разрабатывается компанией OpenAI с 2022 года и был протестирован с группой клиентов в конце 2023 года. В ходе этого процесса программное обеспечение продемонстрировало способность поддерживать чтение, переводить контент между разными языками и создавать голоса для людей, утративших способность говорить.

Однако OpenAI также подчеркнула потенциальные риски технологии имитации голоса, особенно в контексте президентских выборов в США. Это одна из причин, по которой они решили ограничить доступ и не делать эту технологию широкодоступной.
По данным компании, которой принадлежит ChatGPT, анонс Voice Engine призван побудить менеджеров и общественность повысить бдительность в отношении мошенничества с использованием искусственного интеллекта. Разработчики также предупреждают, что преступники могут использовать программное обеспечение для имитации голоса, чтобы украсть личную информацию или взломать системы безопасности банка.
«Важно, чтобы люди понимали, в каком направлении движется эта технология, независимо от того, будем ли мы выпускать ее широко или нет», — заявили в OpenAI.

Технология редактирования голоса с использованием искусственного интеллекта привлекла внимание после того, как в январе в социальных сетях появилась вирусная запись, имитирующая голос президента США Джо Байдена, призывающего людей «не участвовать в праймериз Демократической партии в Нью-Гэмпшире».
Компания Pindrop Security, специализирующаяся на обнаружении мошенничества с голосом, проанализировала запись и пришла к выводу, что это дипфейк, созданный с использованием технологии ElevenLabs — стартапа, разрабатывающего программное обеспечение на основе искусственного интеллекта, которое генерирует голоса на более чем 20 языках.
По данным журнала Fortune, поддельный голос г-на Байдена вызвал обеспокоенность у многих экспертов и должностных лиц избирательных комиссий США, назвав его «попыткой вмешательства в выборы с помощью искусственного интеллекта». Некоторые оценки показывают, что распространять аудиоподдельные записи не только легко, но и существует риск того, что злоумышленники будут использовать эту технологию, чтобы повлиять на результаты выборов и отговорить избирателей идти на избирательные участки.