Tous les inventaires du Catalogue général des manuscrits (CGM) dans un seul jeu de données !
Le Catalogue général des manuscrits (CGM) comprend la description des manuscrits et fonds d’archives des bibliothèques publiques, hors BnF et bibliothèques de l’Enseignement supérieur. Cette base constitue l'un des trois catalogues en ligne français de manuscrits avec BnF-Archives et manuscrits (pour la BnF) et Calames (pour les établissements de l'Enseignement supérieur).
Après le chargement initial, issu de la rétroconversion des volumes imprimés, plusieurs institutions ont rejoint le CGM et participé à son enrichissement. Depuis janvier 2019, la mise à jour est effectuée directement par les établissements, à l'aide de l'outil TapIR développé par la BnF.
Des données sous Licence Ouverte
Depuis le 1er janvier 2018, les données du Catalogue collectif de France (CCFr), y compris celles du CGM, sont sous Licence Ouverte. Cela permet leur réutilisation libre et gratuite contre la seule obligation d’en mentionner la source.
Cette ouverture correspond à la mission du CCFr, qui est de mettre en valeur le patrimoine des bibliothèques françaises. Elle suit par ailleurs le processus d’ouverture des données publiques encouragé par l’Etat.
A cette occasion et pour faciliter l’accès, les données ont été extraites des bases citées ci-dessus pour constituer des jeux de données mis à disposition sur plusieurs plateformes de diffusion.
Le jeu de données du CGM
Mis à jour le 25 juin 2019, le jeu de données du CGM se présente sous la forme d’un fichier compressé 7z de 46 Mo. Une fois décompressé, ce sont 959 fichiers XML-EAD en provenance de 425 établissements qui sont réutilisables.
Pour en savoir plus et pour télécharger le jeu de données, vous pouvez consulter les sites :
Ingénieure de recherche (Analyse de sources historiques et culturelles), Section arabe de l'Institut de Recherche et d'Histoire des Textes
5 ansEnfin l'opportunité de faire connaitre les manuscrits qui sommeillent dans les bibliothèques de province. Mais beaucoup de travail pour les manuscrits orientaux dont les contenus sont incompréhensibles et donc pour encore longtemps ininterrogeables. On a du boulot devant nous :)