Logilab gère les données de la Bibliothèque Nationale de france

Logilab a développé sur la base de CubicWeb le site data.bnf.fr, pour la Bibliothèque nationale de France, mettant à disposition tout un ensemble d'informations fusionnées et cohérentes sur les œuvres et les auteurs, et ce, aux standards du Web et du Web sémantique.

Ces informations sont issues de différentes bases internes à la BnF et ont été liées à des sources de données externes, comme DBpedia ou Geonames, afin d'insérer les données du site au cœur du Web sémantique et d'enrichir contextuellement les éléments présentés. Le serveur applicatif est centré sur le modèle des informations manipulées et contient de nombreuses fonctionnalités pour importer des jeux de données issus de différentes sources (catalogues internes), de tisser des liens entre les éléments issus de ces sources ainsi qu'entre ces éléments et des bases publiques externes telles que DBpedia, Geonames ou MusicBrainz.

Ces fonctionnalités s'appuient sur des algorithmes d'alignement, de calcul de distance intertextuelle, ou de classification, choisis et validés par Logilab dans le cadre du projet. Les informations fusionnées ainsi obtenues sont ensuite publiées dans un format permettant leur exploration avec un navigateur (HTML ou vues spécialisées comme des frises chronologiques ou des cartes) et dans des formats permettant la réutilisation des données (notamment RDF et JSON).

Une des étapes les plus importantes de cette prestation a été la conception d'un modèle de données (une ontologie) permettant de décrire l'ensemble des informations à réunir dans l'application, en fonction des besoins actuels, des besoins imaginés pour le futur et des fonctionnalités souhaitées. La plateforme CubicWeb présente ici l'énorme avantage de mettre le modèle de données au cœur de la solution et d'offrir tout un ensemble d'outils permettant de le faire évoluer de manière sécurisée.