Parmi les missions de la Bibliothèque nationale de France, figure l'archivage des pages web publiées dans le pays. Une façon de conserver une archive de ce qu'ont écrit et publié les Français, en particulier pendant cette période de confinement.

Le site François Mitterrand de la Bibliothèque nationale de France, à Paris © Maxppp / Luc Nobout / IP3 Press

Que restera-t-il de la crise du Covid-19 ? Comment les historiens en parleront-ils ? A partir de quelles sources ? On ne le sait pas forcément, mais en plus de son travail de conservation de toutes les publications écrites qui paraissent en France (le fameux Dépôt légal, voulu par François Ier), la Bibliothèque nationale de France archive également les contenus mis en ligne sur le web.

Une tâche vertigineuse qui permet d'avoir une photographie de la France à un instant T. Ces petites choses qui font l'air du temps, comme les hashtags #meToo, #JeSuisCharlie et désormais #OùSontLesMasques ne sont pas si petites pour la BNF, qui leur réserve ses honneurs.

Un archivage mené par des robots

En effet, l'archivage n'est pas réservé qu'aux travaux dits "nobles" : "On a l'habitude de penser aux livres : le dépôt légal porte bien sûr sur des produits qu'on peut estimer très finis, très pensés... Mais aujourd'hui, parler de cette mémoire du temps présent, parler de ce patrimoine du quotidien, c'est parler du web", explique Laurence Engel, présidente de la BNF. "Tout peut être intéressant, tout peut faire patrimoine. En tout cas, si on s'intéresse à la vie, à la société telle qu'elle est, si on veut en garder une trace, alors il ne faut pas juger, il faut conserver ce qui est produit, parce que dès lors que c'est produit, ça présente un intérêt", ajoute-t-elle.

"On ne peut pas savoir aujourd'hui ce que seront les sujets d'étude de demain."

Pour obtenir cette photographie du web français, des robots sont programmés. Mais il existe aussi des collectes plus sélectives en fonction des événements : avant l'épidémie de Covid-19 et le confinement, il y a eu "l'incendie de Notre-Dame, les retraites, les "gilets jaunes", les attentats terroristes de 2015". "Ces événements qui surviennent et génèrent une activité sur le web donnent lieu à une collecte spécifique, avec ce désir de repérer les choses et de les conserver de manière pérenne pour les générations futures", ajoute la présidente.

Avis aux paranoïaques : ce travail n'a rien à voir avec de l'espionnage. N'est collecté que ce qui est déjà public.