OpenAI создал инструмент клонирования голоса

31.03.24

0

1 759

0

Поскольку дипфейки распространяются, OpenAI совершенствует технологию, используемую для клонирования голосов, но компания настаивает, что делает это ответственно.

Voice Engine, который разрабатывался около двух лет, позволяет пользователям загружать любой 15-секундный образец голоса для создания синтетической копии этого голоса. Но еще нет даты публичного доступа, что даст компании время отреагировать на то, как модель используется и злоупотребляет ею.

"Мы хотим убедиться, что все чувствуют себя хорошо, как это разворачивается — что мы понимаем, где эта технология опасна, и у нас есть средства смягчения этого",  сказал Джефф Харрис, член команды продукта OpenAI.

По словам Харриса, модель генеративного искусственного интеллекта, которая работает с Voice Engine, некоторое время скрывалась на виду.

Эта же модель лежит в основе голоса и возможностей "читать вслух" в ChatGPT , чат-боте OpenAI на основе искусственного интеллекта, а также предварительно настроенных голосов, доступных в API преобразования текста в язык OpenAI. И Spotify использует его с начала сентября, чтобы дублировать на разных языках подкасты для таких известных ведущих, как Лекс Фридман.

OpenAI
Image Credits: Pixabay

Такие модели, как та, что использует Voice Engine, обучаются на огромном количестве примеров  в данном случае это записи речи  обычно из общедоступных сайтов и наборов данных в сети. Многие производители генеративного искусственного интеллекта видят обучающие данные как конкурентное преимущество, поэтому хранят их и связанную с ними информацию поблизости. Но детали учебных данных также являются потенциальным источником судебных исков, связанных с интеллектуальной собственностью, что является еще одним фактором, который препятствует раскрытию многого.

"Мы берем небольшой образец аудио и текста и создаем реалистичную речь, которая соответствует оригинальному оратору", — сказал Харрис. "Используемое аудио удаляется после завершения запроса".

Как он объяснил, модель одновременно анализирует речевые данные, из которых она извлекает, и текстовые данные, предназначенные для чтения вслух, генерируя соответствующий голос без необходимости создавать специальную модель для каждого динамика.

В зависимости от того, как пройдет предварительный просмотр и как общественность воспримет Voice Engine, OpenAI может выпустить инструмент для более широкой базы разработчиков, но пока компания не желает делать что-то конкретное.

Однако Харрис кратко заглянул в дорожную карту Voice Engine, обнаружив, что OpenAI тестирует механизм безопасности, с помощью которого пользователи читают случайно сгенерированный текст как доказательство того, что они присутствуют и знают, как используется их голос. 

Источник: TechCrunch

Оставить комментарий

Актуальное

Фанат борьбы со старением Брайан Джонсон хочет начать «секвенирование фудома»

Аналитика

Фанат борьбы со старением Брайан Джонсон хочет начать «секвенирование фудома»

Аналитика

Так же, как секвенирование генома определяет генетический состав организма, Брайан Джонсон — инвестор и основатель движения Don't Die — хочет начать с...

26.03.25

461

0
Как BYD планирует сделать зарядку электромобиля такой же быстрой, как заправка бензобака

Инновации

Как BYD планирует сделать зарядку электромобиля такой же быстрой, как заправка бензобака

Инновации

Китайский автопроизводитель BYD на этой неделе произвел фурор, объявив, что его новый седан Han L может проехать до 248 миль всего за пять минут. Как...

24.03.25

907

0
В тюрьмах США начали выдавать VR-шлемы

Инновации

В тюрьмах США начали выдавать VR-шлемы

Инновации

Саманта Товар, известная как Роял, впервые за три недели покинула свою камеру. Сотрудники исправительного учреждения отвели ее в общую зону женского и...

20.03.25

959

0
Подпишитесь на нас

Раз в неделю мы будем отправлять Вам самые интересные новости недели

Конфиденциальность гарантирована

Популярные статьи

Для еліти будують бункер вартістю 300 мільйонів доларів

Бизнес

Для еліти будують бункер вартістю 300 мільйонів доларів

Недвижимость

В 2026 году планируется открытие роскошного бункера «судного дня», предназначенного только для членов, с бассейнами, охраной здоровья на основе искусс...

25.01.25

44 317

0
Гранты для поддержки идей и бизнеса 2024

Гранты для поддержки идей и бизнеса 2024

В Украине можно получить грант на бизнес или реализацию идеи. Война не остановит рост экономики и прогресс в развитии нашей страны. Рассказываем об ук...

15.01.24

7 698

2
10 главных финтех-инноваций, которые вы должны знать

Инновации

10 главных финтех-инноваций, которые вы должны знать

Fintech

Финансовые технологии или финтех — это больше, чем просто модное слово в мире финансовых услуг. Пользователи, а также предприятия догоняют тенденции в...

12.10.23

6 025

1
Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Макдональдс: Гамбургеры на первом плане, но недвижимость - основа дохода

Знали ли вы, что крупнейшая сеть заведений быстрого питания, "Макдональдс", на самом деле получает большую часть своих доходов от недвижимости? За вит...

08.11.23

5 661

1
Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google говорит, что его новый квантовый чип указывает на существование нескольких вселенных

Инновации

Google в понедельник анонсировала Willow, свой последний, самый лучший квантовый вычислительный чип. Заявления Google по этому чипу о скорости и надеж...

11.12.24

5 657

0

 

Опрос
В какой соцсети вы проводите больше всего времени?
Facebook
13% (41)
Instagram
6% (20)
TikTok
9% (30)
Telegram
23% (74)
Youtube
31% (99)
Twitter
2% (5)
А что это?
15% (48)
Оставить комментарий

Нажав «Принять все cookie-файлы», вы соглашаетесь на размещение всех cookie-файлов на вашем устройстве. Вы можете изменять настройки cookie-файлов или отозвать ваше согласие на их использование в любое время, нажав на «Настройки cookie-файлов».