La preservación de contenidos online es uno de los grandes desafíos de la actual sociedad digital: generamos una cantidad de información mayor que en ningún momento previo de la historia, pero gran parte de ella puede perderse al mismo endiablado ritmo en que la producimos.
Por eso han surgido iniciativas como Archive.org, que busca crear un repositorio de contenidos capaz de reflejar los cambios en el contenido de la WWW. Pero, ¿por qué conformarnos con un único repositorio centralizado cuando cualquier usuario podría crearse una versión reducida para salvaguardar los sitios web más relevantes para él?
Y como respuesta a dicha pregunta nació ArchiveBox, una solución de archivado autohospedada (es decir, que tendremos que instalar en nuestro propio equipo de trabajo o servidor) y desarrollada en Python (concretamente, requerirá que tengamos instalado Python 3.7 o superior) que podemos usar en sistemas:Unix (como Linux, BSD y macOS).
Windows (si ejecutamos Docker desde WSL2).
En Xataka
Nuestro plan para conservar las webs de hace años está fracasando: de Archive.org a los enlaces rotos de medio internet
Según sus instrucciones de uso (aquí tienes todo lo que necesitas para instalarlo y usarlo), "sólo se tarda unos 5 minutos en poner en marcha ArchiveBox".
Y una vez instalado su funcionamiento es simple: le proporcionamos las direcciones URL de las páginas que deseamos archivar, y el propio software se encarga de guardarlo en el formato adecuado en relación con el contenido del …