Des normes aux métadonnées par Elizabeth
Giuliani,
adjointe au directeur du département de l’audiovisuel
de la BnF
L'enjeu des nouvelles technologies pour l'indexation
des documents musicaux
En se généralisant, les technologies numériques interfèrent
largement sur les aspects intellectuels et physiques de l'accès
aux documents musicaux. Elles rapprochent les références à
des collections distantes de celles des documents consultables
sur place ; elles associent tous les médias, accessibles eux-mêmes
sur de multiples supports ou à distance ; elles confondent
les données elles-mêmes et les informations complémentaires
qui en assurent l'interprétation (biographies, chronologies,
analyses d'œuvres...) ainsi que les métadonnées qui permettent
d'y accéder et de les mettre en perspective.
1) A quoi veut-on accéder ?
Dans un contenu musical, les éléments auxquels il est pertinent
d'accéder sont multiples en nombre, mais aussi divers en nature.
Les documents proposent une multiplicité de genres musicaux,
de présentations et de supports ; les utilisateurs présentent
une disparité d'usages et de niveaux d'expertise.
En outre, varient le domaine et le niveau de l'information
musicale recherchée. Elle peut ressortir du contexte et du
répertoire, de l'œuvre ou du matériau.
Les documents se rapportant à de la musique étant multiformes
et l'information musicale elle-même complexe, les critères
d'indexation nécessaires pour y accéder sont divers.
Certains (les critères dits signalétiques) sont extraits
du document lui-même et plus ou moins reformulés : le nom
des auteurs ou des interprètes, le titre des œuvres, l'année
ou le lieu de la publication.
D'autres (les critères analytiques, les critères systématiques)
proviennent d'une déduction ou d'une analyse des informations
contenues : les formes, les thèmes, les fonctions... exprimées
au moyen de nomenclatures ou thesaurus.
Ces données secondes, passent par une formulation linguistique
: un vocabulaire, une syntaxe et une sémantique.
Il est d'autres types d'accès qui se réfèrent directement
à des paramètres musicaux : timbres, hauteurs, durées, contours
mélodiques. Ces données empruntent aux divers modes de formalisation
de la musique : la notation ou la fixation des sons.
2) Comment peut-on y accéder ?
Les accès qui passent par une formulation de mode linguistique
recourent aux outils d'indexation "traditionnels"
de la documentation, aujourd'hui touchés par les profondes
mutations. Ils pourraient retirer un bénéfice considérable
des redéfinitions radicales qui affectent le traitement bibliographique
: la maille des objets d'information manipulés, les liens
entre données, le rapport des données primaires et secondaires...
Mais les nouveaux «modèles», tels les FRBR,
reproduisent certains des schémas "livresques" de
leurs aînés (ISBD par exemple). Dans le
monde des bibliothèques, en effet, l'indexation documentaire
a longtemps associé contenu et présentation matérielle (support)
mais dissocié l'accès à l'information de la consultation du
document lui-même. La problématique des métadonnées prend
acte de la fin de ces frontières et appelle une nouvelle organisation
d'objets d'information éclatés. Les bibliothèques musicales,
après avoir travaillé à l'adaptation des normes et de formats
bibliographiques aux notions musicales (titres uniformes d'œuvre,
distribution d'exécution, matières musicales...), doivent s'engager
aujourd'hui dans les réflexions nationales et internationales
sur la modélisation des concepts ou des processus, la structuration
des données et le balisage des documents et les outils d'interopérabilité.
La remise en cause est plus radicale encore si l'on accepte
d'envisager en outre, au cœur des contenus, non plus le texte
et les signes linguistiques, mais d'autres codes (la notation
musicale) et les objets sensibles eux-mêmes, images et sons.
Il s'agit, pour traiter du second type d'accès à l'information
musicale, d'utiliser et d'interpréter les "balisages"
inscrits avec les formes numériques de la notation musicale
ou de la fixation phonographique et de faciliter le repérage,
dans une partition ou un flux de sons, d'une séquence, d'un
élément.
Est donc amorcée une réflexion plus prospective pour élaborer
des outils logiciels permettant d'un côté la segmentation
automatique et paramétrable d'un ou plusieurs programmes sonores
en simultané et offrant, d'un autre côté, des modes graphiques
de transcription visuelle des données sonores. Ainsi la comparaison
et l'analyse d'enregistrements disposeraient-elles d'outils
interactifs et de représentations mesurables.
En regard, les nouvelles technologies affectent aussi le contenu
musical ou, du moins, son appréhension. Ils permettent que
convergent des modes de consultation jusque-là fondamentalement
étrangers : la "lecture" synchronique de la partition
et la prise en compte temporelle de l'enregistrement. De nouveaux
champs d'étude pourront se développer et, déjà, des domaines
musicaux trouver leur valeur épistémologique : tous ceux liés
à l'interprétation et à l'écoute, notamment.
3) Quels outils promouvoir ?
Pour la production des informations documentaires, s'impose
l'utilisation des schémas de métadonnées. Comme jadis, avec
les formats de description bibliographique, il en existe de
généraux aux divers types de médias et de contenus (tel le
Dublin Core) qu'il convient d'enrichir
en informations indispensables pour accéder à des données
musicales : à l'instrumentation, à l'interprétation et à sa
fixation ... Dans les schémas de structuration et d'encodage
des éléments d'information qui sont en cours d'émergence (MPEG
7, XML), les besoins de l'information
musicale doivent également être définis.
En matière d'outils d'accès, il faut ajouter aux outils de
recherche traditionnels (fichiers d'autorité, index ou thesaurus),
des outils plus "libres" permettant le feuilletage
et, surtout, des instruments adaptés au contenu musical (segmentation,
montage, reconnaissance et extraction automatique d'éléments
musicaux signifiants à partir de partitions ou d'enregistrements).
Les systèmes d'information doivent assurer la complémentarité
et la solidarité, entre les données indexées et les données
indexantes. Pour ce faire doivent être étendues aux informations
musicales, les normes de structuration des documents (SDML
ou Niff pour la musique notée) ou de stratégie
de recherche (sur le modèle de TREC, text
information retrieval).
Les interfaces de consultation doivent s'enrichir d'outils
adaptés permettant la synchronisation et la comparaison :
l'image de la partition et le flux de l'enregistrement, la
représentation graphique du son etc.
Enfin, autre actif à porter à la généralisation des technologies
numériques, l'interopérabilité, doit atteindre également les
sources de données musicales et, notamment, permettre un travail
commun entre les producteurs de l'information (auteurs, producteurs,
éditeurs) et les documentalistes. Elle est aussi fondée sur
l'adoption de normes partagées : des identifiants (ISMN,
ISRC, ISWC) pour pister
les objets musicaux échangés ; des protocoles d'interconnexion
des systèmes (Z 3950).
Cette panoplie d'outils d'indexation et de recherche n'offrira
un réel service standard aux usagers des lieux ou sites de
documentation musicale qu'après que la technologie numérique
aura investi non seulement le traitement bibliographique et
la production des données secondaires (c'est largement le
cas aujourd'hui) et, surtout, quand elle gérera plus largement
l'information musicale elle-même, directement produite sous
forme numérique ou transférée à la faveur de programmes de
préservation ou de mise en valeur.
Glossaire
- Dublin
Core
- Norme définissant un ensemble minimum d'éléments d'information
caractérisant les ressources du Web et permettant d 'y accéder
facilement. Ce schéma est né au cours d 'une réunion, tenue
à Dublin (Ohio), en 1995, à l'initiative conjointe d'OCLC
et du NCSA
[National Center for Supercomputing Applications].
FRBR Functional Requirements
for Bibliographic Records
- Spécifications fonctionnelles des notices bibliographiques
Modèle conceptuel de données élaboré par un groupe d'experts
de l'IFLA
(Fédération internationale des associations de bibliothécaires
et des bibliothèques) de 1992 à 1997.
ISBD International Standard
Bibliographic Description
- Cadre général défini par l'IFLA,
à partir de 1977, pour la description bibliographique de
tous les médias disponibles dans les bibliothèques. La musique
imprimée (Printed Music) et les enregistrements sonores
(une partie des Non Book Materials) ont fait l'objet d'une
déclinaison particulière.
ISMN International standard
music number (ISO 10957 )
- Identifie toutes les éditions de musique imprimée quelles
qu'en soient la présentation (partition, parties, notation
électronique...) ou les modalités de diffusion (location,
vente, hors commerce...)
ISRC International standard
record code (ISO 3901)
- Identifie les fixations de musique enregistrée.
ISWC International standard
[musical] work code (ISO 15707)
- Identifie les œuvres musicales.
MPEG Moving Picture Experts
Group (ISO/IEC JTC1 WG29)
- Groupe de travail commun à l'ISO (International Organization
for Standardization) et à l'IEC (International Electrotechnical
Commission), chargé de développer des standards pour l'encodage
numérique des signaux audio et vidéo. Constitué en 1988,
le groupe a entrepris un travail sur “Multimedia Content
Description Interface” (MPEG 7), achevé en 2001.
Niff Notation Interchange File
Format
- Standard d'encodage numérique (modèle binaire) de la notation
musicale, fruit d'une collaboration entre de grands producteurs
de logiciels musicaux et d'experts de la notation/représentation
musicale.
Développé hors des cadres normatifs, il est néanmoins un
standard ouvert qui permet l'interopérabilité entre programmes
musicaux implantés sur des systèmes différents.
SDML Standard Music Description
Language
- Langage de représentation de la notation musicale seule
ou associée à du texte, des graphiques et à tout type d'information,
notamment multimédia. La norme SMDL, entreprise en juillet
1995, a encore un statut de document de travail (ISO/IEC
DIS 10743), en attente d'un complément qui la rende compatible
avec l'architecture XML.
TREC Text Retrieval Conference
- Groupe d'aide à la recherche en matière de génie linguistique,
copiloté depuis 1992 par le National Institute of Standards
and Technology (NIST) et le Defense Advanced Research Projects
Agency (DARPA).
XML eXtensible Markup Language
- Schéma de balisage, spécifié en 1998 par le W3C
(World Wide Web Consortium), pouvant s'appliquer à tout
type d'information, qui précise comment définir la structure
des données dans un document.
Z 3950 (ISO 23950)
- Norme de Recherche automatique d'information qui définit
un protocole d'interrogation de bases de données bibliographiques,
documentaires ou autres, suivant un mode client-serveur.
Elle s'appuie elle-même sur les normes de communication
TCP/IP et se trouve de ce fait adaptée à Internet. L'agence
de maintenance et autorité d'enregistrement est située à
la Library of Congress.
Elizabeth Giuliani
|