Le ministère de la Culture a publié un arrêté qui va faciliter l’accès aux archives françaises du Web. Alors qu’il était jusqu’ici obligatoire de se rendre à Paris, une vingtaine de bibliothèques de province et même de l’outre-mer pourront dorénavant proposer une consultation de ces précieuses sauvegardes à leurs utilisateurs – sous certaines conditions toutefois.

Un cadre juridique établi en 2006

La Bibliothèque a pour mission de collecter, conserver et communiquer les sites de l’internet du « domaine français » au titre du dépôt légal (Code du patrimoine, articles L131-1 à L133-1 et R131-1 à R133-1). À ce titre, elle moissonne en priorité :

  • les sites en .fr ou autres extensions liées au territoire (.re., .nc., etc.) ;
  • des sites hors .fr (.com, .org, etc.) mais dont les auteurs sont domiciliés en France ou les contenus sont produits en France.

Les collectes sont réalisées à l’aide de robots qui copient pages, images, animations, fichiers audio et vidéo. Les sites sont ensuite datés et indexés pour être restitués dans leur contexte de publication original, ce qui permet de naviguer dans les archives comme sur l’internet, en cliquant de lien en lien.

Des échantillons représentatifs

Tous les sites et toutes les pages des sites ne peuvent être archivés. La BnF constitue des échantillons représentatifs de l’internet français en combinant deux modes d’archivage :

  • les collectes larges permettent de constituer des échantillons représentatifs du Web (4 millions de sites en 2013). Réalisées une fois par an, elles portent aujourd’hui principalement sur les domaines .fr et .re, grâce à un partenariat avec l’Association française pour le nommage internet en coopération (AFNIC) et sur les domaines .nc, grâce à un partenariat avec l’Office des postes et télécommunications de Nouvelle-Calédonie.
  • les collectes ciblées portent sur une sélection d’environ 30 000 sites repérés par des bibliothécaires de la BnF ou des partenaires externes. Ces sites sont choisis en raison de leur thème (la littérature, le développement durable…) ou de leur rapport à un événement (comme les élections ou les Jeux Olympiques en 2012). Les collectes ciblées sont soit plus profondes (pour archiver les grandes bases documentaires), soit plus fréquentes (par exemple, une centaine de journaux en ligne font ainsi l’objet d’une collecte quotidienne afin de saisir l’actualité du web).

Modes de consultation

Fin 2013, les archives de l’internet de la BnF contiennent 21,2 milliards de fichiers ; certaines ressources remontent à 1996. La recherche se fait à partir des adresses des sites et, en complément, des « parcours guidés » présentent des sélections autour d’un thème précis, pour une première approche de la collection.
Il n’existe pas de liste complète des sites accessibles dans les archives de l’internet. Cependant, les fiches thématiques de data.bnf.fr signalent les sites web sélectionnés par la BnF dans le cadre des collectes ciblées. Par exemple :http://data.bnf.fr/11932277/litterature_francaise/
Les recherches sur l’ensemble des collections doivent être faites dans les salles de lecture, sur des postes informatiques qui permettent leur consultation. Pour accéder aux archives de l’internet, il faut justifier d’une recherche d’ordre universitaire, professionnel ou personnel, nécessitant le recours aux collections de la Bibliothèque de recherche.

L’arrêté publié ce matin au Journal Officiel va grandement faciliter l’accès au dépôt légal du Web, puisque de nombreux établissements de province (et même au-delà) sont désormais habilités à proposer eux aussi ce service.
Les bibliothèques municipales suivantes devraient ainsi permettre prochainement à leurs utilisateurs de consulter la base de la BNF, vraisemblablement toujours à la condition d’être accrédités :

  • Ajaccio
  • Amiens
  • Angers
  • Besançon
  • Bordeaux
  • Caen
  • Châlons-en-Champagne
  • Clermont-Ferrand
  • Dijon
  • Lille
  • Limoges
  • Lyon
  • Marseille
  • Montpellier
  • Nancy
  • Orléans
  • Poitiers
  • Rennes
  • Rouen
  • Toulouse
  • Strasbourg (bibliothèque nationale et universitaire)

Les départements et collectivités d’outre-mer sont également concernés par cet arrêté, puisque des habilitations ont été accordées à :

  • La Réunion (bibliothèque départementale)
  • La Guadeloupe (bibliothèque des services d’archives départementales)
  • La Guyane (ibliothèque des services d’archives départementales)
  • La Martinique (bibliothèque des services d’archives départementales)
  • Nouméa (bibliothèque territoriale de Bernheim)

La Polynésie française n’est pas pour l’instant sur la liste des sites retenus.

La BNF n’est pas la seule institution à s’occuper en France du dépôt légal du Web. L’institut national de l’audiovisuel (INA) est en effet en charge de procéder à des collectes ciblées, cette fois sur les sites consacrés aux programmes TV et radio, aux Web TV, etc. L’arrêté publié ce matin prévoit donc que certaines bibliothèques municipales soient dorénavant autorisées à proposer l’accès à cette base :

  • Bordeaux
  • Clermont-Ferrand
  • Dijon
  • Grenoble (+ cinématèque)
  • Metz
  • Montpellier
  • Nancy
  • Nantes
  • Nice
  • Pessac
  • Poitiers
  • Rouen

Sources : Next Impact – Xavier Berne / BNF