Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 12/09/2023 10:02

Escrito por: Antonio Vallejo

Así puedes hacer que el rastreador de ChatGPT no obtenga información de tu sitio web para entrenar sus modelos de lenguaje

Así puedes hacer que el rastreador de ChatGPT no obtenga información de tu sitio web para entrenar sus modelos de lenguaje

OpenAI revolucionó la industria tecnológica con el lanzamiento de ChatGPT, un chatbot capaz de interactuar con nosotros en lenguaje natural y que muchos ya han adoptado como herramienta enfocada a la productividad en su día a día. Sin embargo, a no todo el mundo le entusiasma la idea de que esta inteligencia artificial haya sido entrenada con el contenido de infinidad de páginas web sin el consentimiento expreso.

Aunque ya es tarde para hacer algo sobre los datos que ya ha recopilado su modelo de lenguaje, puedes impedir que sus rastreadores afecten a tu sitio web de manera muy sencilla. En este artículo te vamos a enseñar cómo hacerlo.

Cómo impedir el acceso de rastreadores a tu página web

OpenAI utiliza un rastreador web llamado GPTBot. Este rastreador se encarga de recopilar información de sitios web de forma automática para entrenar los modelos de lenguaje de la compañía, entre ellos GPT-4. De hecho, es una práctica muy común y es precisamente uno de los métodos de Google para obtener información sobre el contenido de cualquier página web.

Sin embargo, si quieres impedir que GPTBot se adentre en tu sitio web para obtener información y entrenar con estos datos su modelo de lenguaje, puedes hacerlo de forma muy sencilla. Para ello tan solo tendrás que modificar el fichero ‘robots.txt’ de tu sitio web.










En Genbeta

Las ofertas de trabajo relacionadas con ChatGPT en LinkedIn se multiplican por 21 en menos …

Top noticias del 12 de Septiembre de 2023