Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 14/07/2022 09:12

Escrito por: Marcos Merino

Ya puedes usar BLOOM, una IA de código abierto más potente que GPT-3 que es capaz de generar texto en 59 lenguajes

Los modelos de lenguaje resultan cada vez más sorprendentes: a todos nos vienen a la mente ejemplos de inteligencias artificiales como GTP-2 o GPT-3 de OpenAI, generadores de texto capaces de mantener el sentido y la coherencia del mismo, llegando en algunos casos a resultar indistinguible de un texto escrito por humanos. Sin embargo, esta clase de modelos adolecen de dos defectos:

Casi en su totalidad, son desarrollos privativos, cuyo código permanece inaccesible para la comunidad de investigadores.

Suelen olvidarse de que existen (muchas) lenguas al margen del inglés.

¡BLOOM!

Ahora, ambas cosas van a cambiar gracias al lanzamiento de 'BigScience Large Open-science Open-access Multilingual Language Model', más conocido como 'BLOOM'. El desarrollo de esta IA comenzó en 2021, con el respaldo humano y financiero (100 millones de dólares) de la startup de machine learning Hugging Face (a la que conocerás, por ejemplo, por alojar el generador de DALL-E Mini en su sitio web), aunque también han colaborado Nvidia, Microsoft y el CNRS (el 'CSIC francés').

En declaraciones a VentureBeat, Teven Le Scao, ingeniero de investigación de Hugging Face, ha explicado que Hugging Face hizo uso de los proyectos opensource 'Megatron' de Nvidia y 'DeepSpeed' de Microsoft —ambos basados en el framework de machine learning PyTorch—, creados para permitir a los científicos de datos entrenar grandes modelos de lenguaje.

BLOOM está entrenado para generar texto un total de 59 idiomas: 46 de ellos naturales (incluyendo el español, el catalán y el vasco) y 13 …

Lee toda la nota original aquí

Top noticias del 14 de Julio de 2022

Notasbit

Las mejores noticias de tecnología en un sólo lugar

Ya puedes usar BLOOM, una IA de código abierto más potente que GPT-3 que es capaz de generar texto en 59 lenguajes

Top noticias del 14 de Julio de 2022

El fiasco de Klarna se venía venir y no será el último: esto es lo que nos dice del futuro de las startups

Google Play ahora muestra los datos que recopilan y comparten las apps

Apple Watch Series 8: fecha de lanzamiento, diseño, precio, nuevas funciones y más

Wordle en español de hoy: solución y pistas para el reto 190

8 películas de Netflix para olvidarte de todo durante en verano

Ericsson, Qualcomm y Thales llevarán 5G al espacio

Tiradero Visual de la Semana (N°247)

Fotos del set de Madame Web revelan que la película estará ambientada a principios de los 2000