L’œuvre musicale et sa représentation : problèmes et perspectives

Origine du projet

J’ai eu l’occasion sur ce blog d’évoquer la genèse de Discotheka. Comment, partant d’un besoin personnel, j’ai fini par me retrouver entouré d’une équipe d’informaticiens n’est pas l’objet cet article. En revanche, les chemins qui nous ont conduits, à deux d’abord avec Liberté, puis avec Nicolas et enfin avec François, à concevoir ce projet un peu fou méritent d’être rappelé. D’abord parce que cette histoire constitue en quelque sorte une précritique de l’état de l’art (bases de données, solutions personnelles de classement etc), ensuite et surtout parce que le chemin parcouru justifie notre existence précisément parce qu’il met en lumière les manques d’un marché qu’on aurait pu croire largement couvert.

Nos premiers développements cherchaient à proposer une solution de classement conçue à partir du logiciel 4 D. J’avais couché sur le papier mes besoins en terme de classement, proposé la création d’un logiciel destiné à être vendu aux collectionneurs. Quelque chose de simple pensais-je, mais qui s’est avéré impossible à réaliser avec les solutions existantes.

Le fait que des entreprises bien plus importantes (Amazon, Alapage…) ne parviennent pas à fournir un service de recherche efficace me semblait à cette époque inconcevable. Pourtant, les services informatiques étaient incapables de proposer au client un quatuor à partir d’une requête orientée vers la musique de chambre. Cette incapacité nous offrait de sérieuses perspectives économiques, mais les difficultés auxquels se heurtaient les vendeurs en lignes, nous les connaissions aussi.

De fil en aiguille, d’impasses en culs-de-sac, nous avons fini par considérer que le projet, tel qu’il était défini, ne pouvait aboutir. Trop coûteux en terme de développement, trop complexe pour être facilement réalisé avec des produits clefs en main. La rencontre avec François a permis de réorienter nos développements, à une période où l’avenir de Discotheka était clairement remis en question.

Situation actuelle

L’analyse des problèmes posés conduit assez vite à établir une critique des solutions technologiques généralement choisies. En effet, écartelés entre les algorithmes de Google et les bases de données monolithiques développées par les vendeurs en ligne, les utilisateurs ne parviennent pas à trouver ce qu’ils cherchent1 . Concernant le seul domaine de la musique classique, la prise en compte de tous les aspects nécessaires à un catalogage sérieux reviendrait à créer une sorte d’usine à gaz que plus personne ne parviendrait à gérer2 .

La dispersion de l’information sur Internet et le changement progressif du comportement des auditeurs a conduit à un curieux paradoxe. D’une part le marché de la musique est passé d’une situation de relative pénurie (les magasins opérant généralement une première sélection) à une situation d’abondance (les rayonnages des magasins virtuels ne connaissent pas de limite et les possibilités de diffusion offertes par le Net sont virtuellement illimitées), d’autre part les outils de recherches qui ont remplacé les vendeurs ont réduit les offres réelles à leur portion congrue. En effet, en l’absence d’un moteur de recommandation digne de ce nom, cette apparente abondance d’offre conduit l’auditeur à n’écouter qu’une poignée de titres : Il suffit de se rapporter au top des titres les plus écoutés sur les plateformes de streaming pour se rendre compte de cet état de fait.

Public concerné

Les besoins de recherche, à l’évidence, concernent tous les acteurs de ce nouveau marché. Les collectionneurs qui souhaitent trouver la perle rare – voire un titre perdu dans une montagne de vieilles cires -, les vendeurs en lignes qui doivent répondre au besoin de leurs clients, les musiciens qui cherchent à diffuser leurs musiques, les radios et les sites internet qui vivent de cette diffusion et, pour finir, les sociétés de perception des droits d’auteurs qui doivent rétribuer les artistes et donc connaître précisément l’origine des sources offertes aux auditeurs (partition, interprète etc.), tous ont besoin de savoir précisément ce qui existe et d’en identifier la source (CD, LP, web radio etc).

Le site américain Digital Music News révélait il y a peu que l’organisme de gestion collective américain SoundExchange, en charge de la perception et de la répartition des revenus du streaming non interactif aux États-Unis (webradios et services de radio personnalisée de type Yahoo ou Pandora), était dans l’impossibilité de reverser à l’ensemble des artistes diffusés sur le net les émoluments qu’ils étaient en droit d’attendre. « Le montant de ces sommes était de 96,7 millions de dollars fin 2006, de 192,7 millions fin 2007, et de 260 millions mi-2008, indique Digital Music News »3. Une manne financière qui dort sur les comptes en banque de SoundExchange en attendant d’être un jour reversé aux artistes.

Problématiques générales

Pour résoudre ces problèmes, il ne s’agit pas seulement d’apporter une solution technique. Serait-elle même possible sans étude préalable d’un domaine dont la complexité nécessite des compétences musicologiques poussées, elle ne permettrait pas d’engranger l’information nécessaire, du moins sans changer les habitudes des éditeurs et sans associer au projet un réseau social actif et compétent. Philippe Astor note ainsi la pauvreté des méta-données livrées aux plateformes par les maisons de disques : des « titres, qui sont en général plutôt pauvres, non consolidées et encore fournies, parfois, dans des formats propriétaires […] » « Les auteurs, compositeurs et éditeurs, ajoute-t-il, ont le plus à souffrir de cette situation, [et ce] parce qu’ils sont bien plus mal référencés, dans ces méta-données fournies par les maisons de disques, que les producteurs ou les artistes-interprètes. »4

Musique classique et méta-données

La situation de la musique classique dans le paysage actuel est intéressante. Même si elle ne représente que 5 à 6 % du marché (une niche donc), elle concentre l’ensemble des problèmes de classement et de recherche. Les défaillances des solutions actuelles s’y manifestent plus nettement, rendant nécessaire l’étude de nouvelles technologies de recherche.

Ainsi, inutile d’espérer trouver un disque à partir d’un élément pertinent de la description d’une œuvre. Face à la requête « Beethoven Gilels Six Variations pour piano, en ré majeur, op. 76, sur un thème original », Google parvient bien à faire remonter un enregistrement datant semble-t-il de1968. Mais pas celui de 1952 qu’on retrouve sous le titre 6 Variations on the Turkish March from « Ruins of Athens » in D, Op.76 (http://www.doremi.com/DiscGilComp.html), réédité par Le Chant du monde.

Le mélange des langues rend le problème de la recherche tout aussi difficile : La requête Πιάνο sonata « sol mineur » beethoven Lewis a peu de chance d’être comprise par un moteur de recherche « traditionnel » et renvoyer les mêmes résultats que Πιάνο sonata « G minor » beethoven Lewis, Πιάνο sonata g-Moll beethoven Lewis où bien encore piano sonate « sol mineur » beethoven Lewis. Quant à l’opus de l’œuvre, il ne facilite pas toujours la recherche, dans la mesure où il ne correspond parfois que très partiellement à la réalité de l’œuvre jouée. L’exemple des Études symphoniques, op. 135 est, de ce point de vue, tout à fait éclairant.6

Structure des deux sources constituant les Études symphoniques :

Exemple de montage possible :

On verra dans un prochain article que ces problèmes sont plus nombreux qu’on peut le croire. Certes, une majorité d’œuvres ont une structure relativement stabilisée. Mais la nature même de la musique savante génère cet écart entre une œuvre et sa réalisation sonore. L’histoire même de l’interprétation a ainsi figé des cycles de pièces plus ou moins indépendants dans une présentation monolithique qui, pour la plupart d’entre nous, possède le statut d’œuvre.

Méta-données et description : ancrage historique

On pourrait penser, emporté par l’omniprésence des technologies de l’information, que ces questions de classement sont récentes. Il n’en est rien : dès l’origine du disque, la critique et les mélomanes ont recherché et mis en œuvre des solutions de classement et se sont interrogés sur le statut de ces nouveaux objets. L’informatique vient donner une nouvelle jeunesse à ces questions.

En effet, au-delà des questions pratiques et économiques, le problème des métadonnées a toujours été au centre des industries culturelles. Lorsque l’on parle de catalogues ou de description d’œuvre, c’est bien de métadonnées dont il est question. Le projet Discotheka entend faciliter la gestion de ces métadonnées dans un domaine où leur organisation se pose comme préalable à toute description.

Ainsi, la notion de titre doit être revue à la lumière du formalisme particulier du genre lui-même : ce qu’on appelle titre en musique classique n’est le plus souvent qu’une concaténation d’éléments qui peuvent être attribués à une infinité d’œuvres (genre, instrument, langage…). La connaissance en amont de cette terminologie — ceci incluant la traduction de ces termes — et de sa signification — ce qui lie ces termes entre eux — est donc un préalable à toute nomenclature et à toute opération de catalogage.

De la même manière, la question de l’œuvre en tant que réalisation sonore doit être séparée de sa trace écrite : c’est bien un choix interprétatif qui définit la structure d’une œuvre comme les Études symphoniques, op. 13 de Schumann ou, pour des questions d’instrumentation, les pages pour clavier de Bach. L’œuvre est ainsi divisée en plusieurs entités, chacune dotée de caractéristiques propres. Goodman fait ainsi remarquer que « le travail du compositeur est achevé lorsqu’il a écrit la partition, même si ce sont les exécutions qui constituent les produits finis, tandis que le peintre doit finir lui-même le tableau »7.

Le projet Discotheka : tentative de résolution

Dès l’origine, le projet Discotheka a attaqué de front ces deux grandes classes d’objets en s’appuyant sur une description fine du champ concerné. S’il s’appuie sur Music Ontology qui permet de décrire tous les processus de la composition, de l’édition et de la publication de la musique, il a également élargi la portée de ce projet en proposant de nouvelles ontologies concernant l’ensemble des éléments structurants le domaine de la musique classique (genre, forme, tonalité etc.). C’est donc ces ontologies et la reformulation des catalogues (œuvres d’une part, interprétation d’autre part) qui constituent le cœur du travail poursuivi par notre entreprise.

Développement et recherche

Toute avancée en matière de web sémantique doit passer par un travail de modélisations. Celui ci implique de définir les relations entre les objet et la nature de ces relations. Or ces relation sont souvent complexe. Ainsi, on peine à décrire les notions d’emprunt, de transcription ou de paraphrase qu’implique notamment la description de l’œuvre de Liszt. En effet, « sur les six cent soixante-dix-huit œuvres de Liszt répertoriées exactement par Humphrey Searle, trois cent cinquante et une le sont au titre de transcriptions, adaptations, paraphrases, arrangements, bref des pièces qui ne sont pas, au départ, ˝originales˝ »8. Ce catalogue paraît ainsi incontournable pour comprendre des besoins et créer de nouvelles ontologies, voire de nouveau modèles applicables également au Jazz9. Il l’est doublement puisqu’il permet d’accéder par un chemin sérieusement balisé aux questions ontologiques soulevées par la musique :

-    La musique est-elle un objet mental, physique ? Une entité abstraite universelle pouvant être multiplement instanciée ou bien une entité concrète particulière ?

-    Comment rendre compte du fait que la propriété d’être une œuvre musicale soit attribuée à des entités si différentes ?

-    Qu’est-ce qui contribue à l’identité d’une œuvre musicale ? Qu’est-ce qui fait qu’une œuvre musicale est la même à travers le temps et ses multiples occurrences ?10

Problème industriel

On a dit plus haut l’intérêt de l’industrie pour les questions concernant les méta-données. Ces questions, pour le coup, supposent de mettre à plat toute une série de relations qu’on aura qualifiées à partir d’un matériau préalablement analysé. Pour autant, la réalisation d’un modèle puis d’ontologies chargées d’en rendre compte, enfin la création de catalogues œuvres basés sur ce modèle et ces ontologies semblent impliquer une trop grande rigidité dans les processus conduisant à stocker l’information (refomulation complète des catalogues dans un espace dédié).

En effet, dans un monde idéal, chaque objet aura été décrit et vérifié et toute recherche se basera sur ces données fiables pour aboutir. On voit bien cependant la dimension utopiste d’un projet qui poserait comme préalable de reformuler la totalité des descriptions d’enregistrements aujourd’hui disponibles. Le passage d’une situation bien réelle (et hélas chaotique) à un état plus satisfaisant (un semblant d’ordre permettant d’améliorer tout à la fois les moteurs de recherche et les moteurs de recommandations) est le premier objectif à atteindre pour un projet industriel. D’où une question centrale qui doit être résolue  : comment interpréter des données imprécises en se basant sur une grille d’analyse et sur des ontologies très précises. Une question en suspens donc, sur laquelle nous reviendrons régulièrment.

Mathias Heizmann

  1. « L’interface d’un logiciel comme Spotify, même augmentée des récentes fonctions sociales intégrées, qui introduisent de nouveaux modes d’écoute, de partage et de navigation, reste encore relativement frustrante, en l’absence d’un moteur de recommandation digne de ce nom ». Astor, P. (2010). zdnet.fr. [en ligne] <http://www.zdnet.fr/blogs/digital-jukebox/meta-donnees-de-la-musique-c-est-le-foutoir-39752437.htm>, Consulté le 18 juin 2010 []
  2. « Tout le business de la musique en ligne gagnerait pourtant à ce que les méta-données de la musique soient non seulement toilettées mais enrichies, jusqu’à permettre d’identifier, par exemple, les musiciens de session ou les choristes qui figurent sur un enregistrement. La start-up américaine Decibel a décidé de prendre les choses à bras le corps et de constituer une base de données avec plus de 150 champs d’information par enregistrement, incluant le genre, l’ingénieur du son ou les assistants de production ». Astor, P, ibid []
  3. Astor, P, ibid []
  4. Astor, P, ibid []
  5. « La genèse tourmentée de l’Opus 13 – plusieurs changements de titre de l’œuvre et du nombre de pièces qui la constituent – réflète l’importance et la complexité des enjeux ainsi que la hauteur du défi que s’impose le jeune Schumann lorsqu’il s’attelle à ce que Marcel Beaufils considère comme « une des pages les plus importantes de toute sa vie » ». B. Fournier, Schumann, Etudes Symphoniques, Livret du disque d’Alberto Nosè, Nascor, 2006. []
  6. La modélisation des cette œuvre révèle tout à la fois sa complexité structurelle, l’absence d’un identifiant unique (l’opus) et les variations possibles qu’elle offre aux interprètes : tout pianiste peut légitimement composer sa version des Études Symphoniques sans trahir son auteur. []
  7. Goodman, N. (1976). Languages of Art : An Approach to a Theory of Symbols. Indianapolis/Cambridge : Hackett Publishing, chapitre 3. []
  8. J. Drillon, Liszt transcripteur, Paris, Actes Sud, 1986, op. cit., p. 11. []
  9. On notera que la création d’une ontologie Jazz présuppose de renoncer aux relations binaires : un thème entretient toujours une relation avec un autre thème, mais cette relation ne peut être qualifiée d’égale sans trahir la nature de sa parenté. []
  10. Darsel, S. (2009). Klêsis – Revue philosophique (13). [en ligne] <http://philosophie-en-ligne.fr/klesis/no_13/8-Darsel.pdf>, Consulté le 27 mai 2010 []
Cette entrée a été publiée dans Réflexions diverses, tout sur le projet. Vous pouvez la mettre en favoris avec ce permalien.

Une réponse à L’œuvre musicale et sa représentation : problèmes et perspectives

  1. Ping : Petit portrait en forme d’autobiographie | Florides