Una de las cosas que más caracteriza a alguien es su voz. Puedes escuchar el timbre y tono y seguramente sepas de quién se trate. Las personas invidentes saben mucho de esto, pero lo cierto es que si te fijas mucho seguro que eres capaz de conseguirlo. Y esta característica es la que ha aprovechado OpenAI para que la inteligencia artificial sea capaz de clonar tu voz.
Si pensabas que este momento no iba a llegar, lo cierto es que estabas equivocado. Y es que con una simple muestra con un mínimo de duración puedes estar seguro de que la IA será capaz de hablar con las mismas cualidades que lo haces tú.
La nueva característica de OpenAI: clonar voces
Es de lo más habitual intentar que una persona tenga una voz similar a otra. Algunos son capaces de tener un registro de lo más variado, como puede ser el genio de la interpretación Carlos Latre que ha logrado con mucho trabajo imitar las voces de las personalidades más conocidas de todo el mundo de tal forma que incluso con los ojos vendados jurarías que lo tienes delante. Todo un viaje por la imaginación, sin duda, ¿pero qué pasa si te decimos que una IA también es capaz de hacerlo?.
Tal vez no te sorprenderá mucho con lo avanzada que está, pero si te decimos que OpenAI es capaz de clonar tu voz con tan solo 15 segundos ya es otra cosa. Aunque no te lo creas, hablar durante 15 segundos puede que no sea una tarea fácil, aunque si echas un vistazo a tu WhatsApp te puedes encontrar con mensajes verdaderamente largos de esos que tienes que duplicar la velocidad para enterarte de lo que te cuentan en la mitad de tiempo.
La IA no te pedirá hablar de un tema concreto para reconocer tu voz y modularla. Es lo que han llamado Voice Engine y se trata de un modelo que ha sido desarrollado desde finales del 2022 y que han perfeccionado hasta el día de hoy en el que han encontrado la posibilidad de crear varios modelos de una misma voz con una sencilla muestra y un texto que, posteriormente, puedas incluir para que la IA hable con la voz que le has ofrecido.
La compañía pide cautela
Este avance para muchos puede ser un motivo de duda para otros. Duda ante la ética que supone tener una herramienta capaz de crear una voz con un audio de 15 segundos que la propia OpenAI ha dicho que “se parece mucho al hablante original”. No es de extrañar que a más de uno le salten todas las alarmas, pero desde la propia firma piden cautela.
Según dice la propia compañía que en su día perteneció a Elon Musk están “adoptando un enfoque cauteloso e informado para una publicación más amplia debido al potencial de uso indebido de voces sintéticas”, a lo que suma el “inicio de un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades”.
Queda patente la intención de que la ética está muy presente en el mundo de la inteligencia artificial moderna así como ya se planteó en su momento con la robótica.