clonación de voz
La IA de OpenAI revoluciona la creación de voces con solo 15 segundos de audio
OpenAI, la empresa detrás del innovador ChatGPT, ha dado a conocer su última creación: Voice Engine, una herramienta capaz de replicar voces humanas a partir de breves fragmentos de audio, tan solo 15 segundos de duración.
El equipo de desarrollo de OpenAI ha destacado la capacidad de su software para generar voces emotivas y realistas utilizando técnicas de inteligencia artificial. Esta tecnología permite no solo clonar voces en el mismo idioma, sino también realizar traducciones automáticas a otros idiomas según sea necesario.
Aunque la tecnología aún está en una fase de acceso limitado, con solo unos pocos desarrolladores teniendo acceso previo, se vislumbra un gran potencial. Jeff Harris, miembro del equipo de producto de OpenAI para Voice Engine, señaló que estas primeras implementaciones están ayudando a perfilar el enfoque de la compañía y a considerar las posibles aplicaciones en diversas industrias.
Entre los beneficios potenciales se encuentra la ayuda a personas con discapacidades en el habla para comunicarse más fácilmente, así como la posibilidad de crear versiones dobladas en múltiples idiomas de manera casi instantánea para productos de audio.
Sin embargo, OpenAI también reconoce los riesgos asociados con esta tecnología. Con el creciente fenómeno de los "deepfakes", la empresa ha implementado medidas de seguridad, como marcas de agua para rastrear la procedencia de cualquier audio generado por Voice Engine, y un monitoreo activo de su uso.
"Reconocemos los serios riesgos que conlleva generar discurso similar al de personas reales, especialmente en un año electoral", señaló un portavoz de OpenAI. La compañía está comprometida a trabajar en colaboración con gobiernos, medios de comunicación y otros sectores para abordar estas preocupaciones y garantizar un uso responsable de su tecnología.