La llegada de inteligencias artificiales generativas a nuestras vidas encabezadas por ChatGPT ha hecho lo obvio: que muchas otras empresas se suban al carro y haya una buena cantidad de alternativas y herramientas similares. Ideogram o el propio Copilot de Microsoft son prueba de ello.
Y el ritmo no para, porque hay una IA que no deberíamos ignorar en toda esta revolución. Se llama Whisper V3, es capaz de transcribir cualquier audio que le mandes y lo podemos utilizar sin problemas incluso desde el iPhone.
Qué es Whisper V3
Whisper V3 es un modelo de reconocimiento de voz basado en IA, capaz de transcribir audios donde haya conversaciones. Es capaz de hacerlo en varios idiomas, incluyendo el español; y a diferencia de otros motores es open source. Su código puede consultarse por cualquier persona desde Github.
El motor de Whisper V3 no es ninguna broma: es el resultado de aprender reconocimiento de voz a partir de más de un millón de horas de audio, y se han afinado tanto las correcciones que en el caso del español su margen de error baja ya del 5%. Incluso detecta las pausas en las conversaciones, traduciéndolas en forma de signos de puntuación en el texto.
El potencial es enorme: para profesionales puede servir para llevarnos un vídeo o una entrevista completa a texto puro, transcrito automáticamente y eliminando mucho trabajo mecánico. A nivel doméstico podría ser la evolución de herramientas como LuzIA, que ya nos …