Fondamenta passe au web sémantique

Fondamenta-music, le premier site français entièrement construit sur une architecture sémantique, vient de voir le jour. Il est le résultat d’une collaboration étroite entre l’équipe du projet Discotheka développé par la société Meaning Engines (Paris) et l’agence Pixelatelier (Caracas).

Certes, dans la toute première version du site, les avantages du web sémantique ne sautent pas aux yeux. Dissimulées au regard, les fondations du site Fondamenta-music.com ouvrent pourtant des nouvelles possibilités, notamment en matière de requêtes contextuelles ou de moteur de recherche multilingue.

Pour y voir plus clair, un petit rappel technique et historique  s’impose.

Le terme « Web sémantique » désigne l’ensemble des moyens pour parvenir à un Web intelligent permettant aux ordinateurs de dialoguer les uns avec les autres pour échanger des informations concernant n’importe quel domaine, dès l’instant où il aura été décrit selon des normes strictes.

Le but est d’amener les ordinateurs à effectuer des recherches intelligentes à l’instar des humains que nous sommes, recherches basées sur des descriptions qui leur soient accessibles. À l’opposé des technologies actuelles reposant sur l’idée de stockage (les bases de données), le Web sémantique ressemble plus “à un guide intelligent, capable d’apporter des réponses complètes et immédiates à des requêtes” (lire là-dessus “Comprendre le web sémantique”) en éliminant les réponses hasardeuses liées par exemple aux homonymes et à l’impossibilité d’associer une série de termes (sonate / presto / piano / « la majeur »…) dans une requête unique. De plus, il offre la possibilité d’implémenter un moteurs de recherche multilingue d’une redoutable efficacité sans imposer de traductions aux concepteurs des sites ou aux opérateurs de saisie qui travaillent au niveau du back-office.

Considéré longtemps comme une utopie, le Web sémantique reste encore aujourd’hui complexe à mettre en place. Là où les bases de données sont, depuis trois décennies, maîtrisées par tout informaticien, le Web sémantique exige la maîtrise d’outils souvent au stade expérimental. De plus, pour fonctionner, il impose un retraitement des données présentes sur le Web mais présentées dans des formats souvent obsolètes, à l’instar du projet IMSLP qui catalogue les œuvres du répertoire classique.

Meaning Engines est une des rares entreprises du secteur à maîtriser à la fois le retraitement de ces données et leurs gestions ainsi que le développement d’un site capable de les exploiter. Cette maîtrise a été rendue possible grâce à des outils novateurs développés en partenariat avec l’INRIA et dix ans de recherche et développement axées sur les problématiques propres au domaine de la musique classique. Ainsi, outre les avantages propres au web sémantique que nous avons détaillé plus haut, notre entreprise propose aujourd’hui un catalogue raisonné et structuré de plus de 75.000 oeuvres classiques que les utilisateurs de nos services peuvent utiliser librement. Ce catalogue, naturellement libre de droit, pourra être approfondi pour améliorer les recherches, en détaillant par exemple les mouvement des oeuvres du répertoire ou en créant des liens entre oeuvres parentes (une symphonie de Beethoven et sa transcription pour piano réalisée par Franz Liszt par exemple)

Fondamenta possède aujourd’hui des fondations d’une solidité à toute épreuve. Le moteur de recherche que nous implémenterons dans une seconde étape de son développement sera capable de répondre à des questions extrêmement fines qu’aucun autre moteur ne pourra traiter. Ces requêtes pourront être formulées dans plusieurs langues européennes pour satisfaire une clientèle internationale exigeante.

Dès aujourd’hui, notre moteur peut être testé en suivant ce lien : http://www.discotheka.com. Tel quel, il permet de trouver des œuvres à partir de requêtes plus ou moins fines formulées en Français, en Allemand, en Anglais, en Italien et en Espagnol. Des oeuvres que le site IMLSP, référence en la matière, peinera à faire remonter dans un contexte similaire.

Mathias Heizmann

Pour aller plus loin : Pourquoi le web sémantique ?

English version

Cette entrée a été publiée dans Brèves, tout sur le projet, avec comme mot(s)-clef(s) , , , , , . Vous pouvez la mettre en favoris avec ce permalien.

Les commentaires sont fermés.