Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 23/11/2024 07:01

Escrito por: Marcos Merino

OpenAI está revolucionando la transcripción de audio a texto con Whisper mientras todos seguimos centrados en ChatGPT y DALL-E

OpenAI está revolucionando la transcripción de audio a texto con Whisper mientras todos seguimos centrados en ChatGPT y DALL-E

Hace un año, los protagonistas del evento DevDay de OpenAI fueron el lanzamiento de GPT-4 Turbo y de los GPTs personalizados (y su correspondiente 'store'). Estas fueron las novedades que acapararon el interés mediático y la atención del usuario… pero había un 'tapado', una nueva IA que, con el tiempo, ha demostrado que merecía mucha más atención que la recibida en su momento.

Os hablamos de la IA de trascripción de audio a texto Whisper V3, una IA open source (al contrario que ChatGPT o DALL·E), por lo que está disponible para su uso online gratuito a través de plataformas como Hugging Face o Replicate, y de varios clientes de escritorio (como el gratuito Buzz o el cliente de pago WhisperScript).

Un antes y un después

Hasta hace no mucho, la transcripción de audio a texto siempre había sido un desafío para la mayoría de los usuarios, pues las herramientas gratuitas a las que podían disponer acostumbraban a cometer numerosos errores. Whisper V2 fue la primera herramienta gratuita que convenció a muchos usuarios…

…pero con Whisper V3 ya tenemos la sensación de que es el equivalente en su campo a ChatGPT —excepto por la parte de ser 100% gratuito—, una IA que los desarrolladores de software van a empezar a breve a implementar en sus propias aplicaciones.

Además, su versatilidad lo hace ideal tanto para tareas simples de transcripción como para aplicaciones más complejas en el campo de la asistencia por voz.








Top noticias del 23 de Noviembre de 2024