OpenAI створив інструмент клонування голосу

31.03.24

0

3 140

0

Оскільки дипфейки поширюються , OpenAI удосконалює технологію, яка використовується для клонування голосів, але компанія наполягає, що робить це відповідально.

Voice Engine, який розроблявся близько двох років, дозволяє користувачам завантажувати будь-який 15-секундний зразок голосу для створення синтетичної копії цього голосу. Але ще немає дати публічного доступу, що дасть компанії час відреагувати на те, як модель використовується та зловживає нею.

«Ми хочемо переконатися, що всі відчувають себе добре, як це розгортається — що ми розуміємо, де ця технологія є небезпечною, і ми маємо засоби пом’якшення цього», — сказав Джефф Харріс, член команди продукту OpenAI.

За словами Харріса, модель генеративного штучного інтелекту, яка працює з Voice Engine, деякий час ховалася на виду.

Ця ж модель лежить в основі голосу та можливостей «читати вголос» у ChatGPT , чат-боті OpenAI на основі штучного інтелекту, а також попередньо налаштованих голосів, доступних в API перетворення тексту в мову OpenAI. І Spotify використовує його з початку вересня, щоб дублювати різними мовами подкасти для таких відомих ведучих, як Лекс Фрідман.

OpenAI
Image Credits: Pixabay

Такі моделі, як та, що використовує Voice Engine, навчаються на величезній кількості прикладів — у цьому випадку це записи мовлення — зазвичай із загальнодоступних сайтів і наборів даних у мережі. Багато виробників генеративного штучного інтелекту бачать навчальні дані як конкурентну перевагу, тому зберігають їх та пов’язану з ними інформацію поблизу. Але деталі навчальних даних також є потенційним джерелом судових позовів, пов’язаних з інтелектуальною власністю, що є ще одним фактором, який перешкоджає розкривати багато чого.

«Ми беремо невеликий зразок аудіо та текст і створюємо реалістичну мову, яка відповідає оригінальному оратору», — сказав Гарріс. «Аудіо, яке використовується, видаляється після завершення запиту».

Як він пояснив, модель одночасно аналізує мовні дані, з яких вона витягує, і текстові дані, призначені для читання вголос, генеруючи відповідний голос без необхідності створювати спеціальну модель для кожного динаміка.

Залежно від того, як пройде попередній перегляд і як громадськість сприйме Voice Engine, OpenAI може випустити інструмент для ширшої бази розробників, але наразі компанія не бажає робити щось конкретне.

Проте Гарріс коротко зазирнув у дорожню карту Voice Engine, виявивши, що OpenAI тестує механізм безпеки, за допомогою якого користувачі читають випадково згенерований текст як доказ того, що вони присутні та знають, як використовується їхній голос. 

Джерело: TechCrunch

Залишити коментар

Актуальне

Хвилина на діагностику: 7 якостей сильного керівника, від яких залежить прибуток

Бізнес

Хвилина на діагностику: 7 якостей сильного керівника, від яких залежить прибуток

Бізнес

Компетентність керівника визначається не стажем і не харизмою, а конкретними поведінковими патернами. У цій статті я розберу сім критеріїв, які слугу...

03.04.26

612

0
Чому структура перемагає ажіотаж і як вона допомагає побудувати сильний та сталий бізнес

Бізнес

Чому структура перемагає ажіотаж і як вона допомагає побудувати сильний та сталий бізнес

Бізнес

Ми живемо в час, коли підприємництво рекламується як риса особистості. Розмістіть логотип, оберіть назву, запустіть сайт, оголосіть про бізнес і почні...

02.04.26

575

0
Розкіш більше не в моді? Чому акції LVMH почали рік найгірше в історії

Аналітика

Розкіш більше не в моді? Чому акції LVMH почали рік найгірше в історії

Аналітика

Акції LVMH почали рік найгірше за всю історію спостережень, оскільки вплив війни на Близькому Сході затьмарює світові економічні перспективи та посилю...

01.04.26

637

0
Підпишіться на нас

Раз на тиждень ми будемо надсилати Вам найцікавіші новини тижня

Конфіденційність гарантована

Популярні статті

10 головних фінтех-інновацій, які ви повинні знати

Інновації

10 головних фінтех-інновацій, які ви повинні знати

Fintech

Фінансові технології або фінтех - це більше, ніж просто модне слово у світі фінансових послуг. Користувачі, а також підприємства наздоганяють тенденці...

12.10.23

9 996

1
Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Штучний інтелект може переглядати ваші електронні листи та виявляти, що у вас роман

Інновації

Під час тестування своєї останньої моделі штучного інтелекту дослідники з Anthropic виявили щось дуже дивне: штучний інтелект був готовий і бажав вдав...

26.05.25

6 605

0
Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic запускає нову модель ШІ, яка «думає» стільки, скільки ви захочете

Інновації

Anthropic випускає нову передову модель штучного інтелекту під назвою Claude 3.7 Sonnet, яку компанія розробила так, щоб вона «думала» над питаннями с...

24.02.25

5 900

0
Огляд передових моделей AI : які моделі змінять світ і як їх використовувати

Огляд

Огляд передових моделей AI : які моделі змінять світ і як їх використовувати

Інновації

Моделі ШІ розробляються із запаморочливою швидкістю всіма, від великих технологічних компаній на кшталт Google до стартапів на кшталт OpenAI і Anthrop...

18.02.25

5 769

0
Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Інновації

Що відомо про стартап DeepSeek, який сколихнув світ технологій?

Стартапи

Напрочуд ефективна та потужна китайська модель ШІ захопила технологічну галузь штурмом. Він називається DeepSeek R1 і дратує нерви на Волл-стріт. Нов...

28.01.25

4 998

0

 

Опитування
У якій соцмережі ви проводите найбільше часу?
Facebook
12% (48)
Instagram
6% (24)
TikTok
8% (34)
Telegram
22% (90)
Youtube
36% (150)
Twitter
1% (5)
А що це?
16% (65)
Залишити коментар

Натиснувши «Прийняти всі cookie-файли» ви погоджуєтесь на розміщення всіх cookie-файлів на вашому пристрої. Ви можете змінювати налаштування cookie-файлів або відкликати вашу згоду на їх використання у будь-який час натиснувши на «Налаштування cookie-файлів».