Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 20/04/2023 04:33

Escrito por: Antonio Vallejo

Las grandes IAs se están entrenando sin consentimiento: así puedes comprobar qué webs se han usado para ello

Las grandes IAs se están entrenando sin consentimiento: así puedes comprobar qué webs se han usado para ello

Hay quienes consideran que el desarrollo de la inteligencia artificial es el siguiente gran avance evolutivo de la humanidad. Y no es para menos, ya que con tan solo propuestas como las que nos está dejando OpenAI con ChatGPT, o con las herramientas de generación de imágenes como DALL-E, Stable Diffusion o Midjourney, son muchas personas las que han comenzado a interesarse por primera vez en este campo.

Sin embargo, una de las grandes preocupaciones sobre estas inteligencias artificiales es el método que han seguido sus responsables para entrenarlas, ya que están basadas en complejos modelos de lenguaje con miles de millones de parámetros recopilados en su gran mayoría de Internet. Esto da entender a que el trabajo de muchísimas personas ha sido utilizado para este propósito, un propósito que en su mayoría tiene un fin lucrativo. Y no son pocos los que consideran a este tipo de modelos de lenguaje como una gran bola de información robada.

IAs entrenadas con información robada

Si bien esto no es ningún secreto, el Washington Post ha realizado una investigación en profundidad acerca de los secretos que se esconden tras este tipo de inteligencias artificiales, dejando a entender que el contenido sin consentimiento es la norma en prácticamente todos los modelos de lenguaje.

Para contextualizar la información presentada, el medio ha investigado en profundidad uno de los dataset más conocidos y que todo el mundo puede descargar: C4 de Google. Y es que si bien ya es colosal todo el conjunto de información …

Top noticias del 20 de Abril de 2023