Si bien la inteligencia artificial ha sufrido una evolución muy notable durante los últimos meses a través de multitud de herramientas generativas como ChatGPT, Bing Chat, o Bard, es posible que una de las más útiles de las que contamos hoy día sea también Whisper. Si aún no la conoces, básicamente se trata de una herramienta capaz de transcribir audio a texto con ayuda de la inteligencia artificial. Su eficacia es sorprendente, y desde su lanzamiento han aparecido aplicaciones que utilizan su API para facilitar su instalación, como Buzz.
Sin embargo, OpenAI no es la única en haberse adentrado en este tipo de proyectos. Meta también lleva un tiempo trabajando en su propia herramienta para transcribir de audio a texto y viceversa en 1.100 idiomas. Denominada por su equipo como MMS (Massively Multilingual Speech), garantizan una gran eficacia y con la mitad de errores de palabra que Whisper.
Un modelo capaz de transcribir a texto unos 1.100 idiomas
A través de un artículo publicado en su web oficial han ofrecido toda la información acerca de esta nueva herramienta, la cual tiene la intención de convertirse en una de las más poderosas en cuanto a transcripción de texto y audio. El secreto de su eficacia, al igual que Whisper, es hacer uso de la inteligencia artificial para reconocer audio en unos 1.100 idiomas, según Meta. No obstante, la herramienta tiene el potencial de reconocer unas 4.000 lenguas de todo el mundo.
Para este proyecto han utilizado Wav2vec 2.0, un modelo que …