OpenAI: Voice Engine

OpenAI je odhodlána vyvíjet bezpečnou a široce prospěšnou AI. Dnes sdílíme předběžné postřehy a výsledky z maloměřítkového náhledu modelu nazvaného Voice Engine, který používá textový vstup a jediný 15sekundový audio vzorek pro generování přirozeně znějícího projevu, jež úzce připomíná původního mluvčího. Je pozoruhodné, že malý model s jediným 15sekundovým vzorkem může vytvořit emotivní a realistické hlasy.

Voice Engine jsme poprvé vyvinuli koncem roku 2022 a používáme ho k napájení přednastavených hlasů dostupných v API pro převod textu na řeč stejně jako v ChatGPT Voice a Read Aloud. Zároveň přistupujeme k širšímu uvolnění s opatrností a informovaností kvůli potenciálu zneužití syntetických hlasů. Doufáme, že zahájíme dialog o zodpovědném nasazení syntetických hlasů a o tom, jak se společnost může přizpůsobit těmto novým schopnostem. Na základě těchto konverzací a výsledků těchto maloměřítkových testů učiníme informovanější rozhodnutí o tom, zda a jak nasadit tuto technologii ve velkém měřítku.

zdroj: openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices, překlad: chat.openai.com