Voice Engine, la herramienta de OpenAI para clonar voz en segundos
OpenAI, líder en inteligencia artificial, ha presentado Voice Engine, una herramienta revolucionaria que permite clonar la voz de cualquier persona con tan solo escucharla 15 segundos.
Una muestra de voz es suficiente
Esta tecnología, aún en fase de prueba, abre un sinfín de posibilidades en diversos campos, desde la traducción de contenidos hasta la creación de experiencias personalizadas.
Voice Engine funciona a través de dos elementos clave: una entrada de texto y una breve muestra de audio del hablante. Con estos datos, la IA genera un habla natural que imita con precisión la voz original, incluyendo incluso sus matices y emociones.
Desarrollada a finales de 2022, Voice Engine ha sido utilizada para mejorar las voces preestablecidas en la API de OpenAI, así como en ChatGPT Voice y Read Aloud. Sin embargo, es ahora cuando se revelan las capacidades más sorprendentes de esta tecnología.
Traducción de contenido de manera eficiente
OpenAI vislumbra un amplio abanico de aplicaciones para Voice Engine. Una de las más prometedoras es la traducción de contenido audiovisual, como vídeos y podcasts. De esta forma, creadores y empresas podrán llegar a una audiencia global sin perder la fluidez y familiaridad de sus propias voces.
Un aspecto destacable de Voice Engine es su capacidad para preservar el acento nativo del hablante original. Por ejemplo, al traducir un audio en español al inglés, el resultado final conservará el acento español del hablante.
Si bien Voice Engine ha demostrado su potencial, su acceso está actualmente muy restringido. OpenAI reconoce los riesgos asociados a la clonación de voces, especialmente en el contexto actual. Por ello, la compañía ha implementado medidas estrictas para evitar el uso indebido de esta tecnología.
Pruebas de esta tecnología con pocos usuarios
Las pruebas de Voice Engine se están realizando a pequeña escala con un grupo selecto de usuarios.
Estos usuarios han aceptado una serie de condiciones para garantizar un uso responsable de la herramienta, incluyendo la prohibición de suplantación de identidad y la obtención del consentimiento del hablante original.