El poder de la IA, voces a tu servicio con Voice Engine, ¿para bien o para mal?
OpenAI, la empresa de inteligencia artificial (IA) conocida por ChatGPT, ha anunciado Voice Engine, un nuevo modelo que convierte texto a voz con un realismo sin precedentes.
Nuevas aplicaciones de la Inteligencia Artificial
La tecnología puede reproducir el sonido natural, las emociones y el acento de una persona a partir de una breve muestra de audio de solo 15 segundos.
Sin embargo, OpenAI se muestra cautelosa con respecto al lanzamiento público de Voice Engine. Reconocen que la capacidad de clonar voces con tanta precisión conlleva “serios riesgos”, especialmente en un contexto como el actual año electoral
Voice Engine abre un abanico de posibilidades para la creación de contenido y la accesibilidad.
Posibilidades y aplicaciones
Permitiría a los creadores traducir su trabajo a otros idiomas sin perder su acento nativo, y ayudaría a personas con dificultades de comunicación verbal a expresarse con su propia voz.
Ejemplo: En una demostración, OpenAI muestra cómo la voz de una persona angloparlante se traduce al español, mandarín, alemán, francés y japonés, conservando el acento original.
Acceso limitado y medidas de seguridad
Por el momento, Voice Engine solo está disponible para un grupo selecto de empresas que han aceptado las políticas de uso de OpenAI.
Entre estas, se encuentran Age of Learning (tecnología educativa), HeyGen (narración visual), Dimagi (software de salud), Livox (aplicaciones de comunicación) y Lifespan (sistema de salud).
OpenAI ha implementado medidas para evitar el uso indebido de Voice Engine. Las voces sintéticas deben ser identificadas como tales, y está prohibido usar la voz de alguien sin su consentimiento.
Además, se han integrado marcas de agua para rastrear el origen del audio generado y se realiza un monitoreo proactivo del uso de la tecnología.
Preocupaciones y riesgos
El desarrollo de Voice Engine reaviva las preocupaciones sobre el uso de voces sintéticas para fines fraudulentos. Este año electoral en Estados Unidos ya se han detectado casos de llamadas automáticas con voces clonadas de políticos como el presidente Joe Biden.
La posibilidad de utilizar Voice Engine para acceder a cuentas bancarias con autenticación de voz también representa un gran riesgo.
OpenAI se enfrenta al desafío de encontrar un equilibrio entre el desarrollo de tecnologías innovadoras y la responsabilidad de prevenir su uso indebido. El futuro de Voice Engine dependerá en gran medida de su capacidad para garantizar la seguridad y la ética en su aplicación.