Estamos en un momento de lucha constante con todas las compañías tecnológicas que tienen como objetivo dar a los usuarios una forma de trabajar con la inteligencia artificial. En este caso, tenemos muchas herramientas en el mercado y una de las más importantes es Gemini de Google. Se trata de una de las herramientas más importantes del día a día de muchas personas, y ahora tendrá muchas más capacidades gracias a un nuevo sistema de carga de archivos.
Esto beneficiará en gran medida a todos los usuarios que quieran tener mejoras cuando se trata de ofrecerle a la IA datos de audio de los que necesitan información o una transcripción casi instantánea una vez que insertes el archivo de audio.
Gemini recibe por fin la capacidad de transcribir grabaciones de audio
Una de las cosas más importantes para los usuarios cuando trabajan con la inteligencia artificial es que esta se adapte a sus necesidades. Por norma general, todas están pensadas para ser de gran ayuda a todos los usuarios con las opciones más simples a la hora de introducir datos como es la entrada de un texto con el que generar cualquier prompt.

Gemini ha sido una de las primeras en demostrar esto de que te estamos hablando, incluso cuando en sus inicios se llamaba Bard. Ahora la nueva IA es capaz de ofrecer un sistema mucho más avanzado de introducción de datos con la llegada de la carga de archivos de audio. La compañía a cargo de Sundar Pichai ha dado con la forma de dar a sus usuarios una forma de añadir y cargar archivos de audio para obtener datos.
En primer lugar, y según lo que cuentan en Techradar, la compañía ha facilitado una manera para que cualquier usuario pueda agregar un archivo de audio a la inteligencia artificial y sacar todo el partido de ese archivo.La nueva función de Gemini incluye tres elementos en los que se divide esta nueva función en la que cargar un archivo de audio.
Uno de los elementos Más interesantes tiene que ver con el sistema de transcripción El cual será de mucha ayuda para pasar a texto todo tipo de conferencias entrevistas a un documento de formato legible que puedas compartir con otros usuarios cuando y como quieras. Esto abre una nueva vía para todos los usuarios que además de crear una transcripción de lo que se ha hablado también se exige una mejora interesante cuando se trata de hacer un resumen de todo lo que se ha hablado.
Además habría que sumar otro elemento importante como es el hecho de que también será posible crear un documento a partir de la información más destacada del audio. Dicho de otra manera, será posible integrar en un solo texto todo lo que se ha hablado en una reunión o conferencia sin que tengas que preocuparte de volver a escucharla y sobre todo teniendo un detalle muy interesante en cuenta como es el hecho de que solamente se pueden utilizar archivos inferiores a 10 minutos.
Una gran diferencia con la versión Live
Como te puedes imaginar esta nueva característica de la inteligencia artificial de Google no solo llega para quedarse, también para aportar grandes mejoras frente a los sistemas que ya estaban disponibles para sus usuarios. Y es que hay que tener en cuenta que existe una versión conocida como Gemini Live, la cual no será tan útil para la aplicación de reuniones en tiempo real ya que no permite la opción de transcripción como lo hace la versión normal con el nuevo sistema de carga de datos.










