Yann POMIE

Le premier savoir est le savoir de mon ignorance : c’est le début de l’intelligence.

- Socrate

  • Introduction
  • Objectif et méthodes
  • État de l’art
    • [[#État de l’art#Le Web Sémantique|Le Web Sémantique]]
    • [[#État de l’art#L’intelligence artificielle|L’intelligence artificielle]]
  • Bibliographie
    • [[#Bibliographie#Abbreviations et sigles|Abbreviations et sigles]]
    • [[#Bibliographie#Sources|Sources]]

Introduction

Depuis le début d’internet il y a une volonté de rendre les données sur la toile interopérables. L’interopérabilité permettrait aux entreprises de pouvoir échanger des données entre leurs systèmes internes mais aussi à les exporter tout en limitant les erreurs que les différences de format pourraient apporter. C’est sur cette problématique que se penchent depuis des années et encore de nos jours divers organismes tel que l’équipe WEB3 du LIRMM, l’OCDE1 et d’autres.

Objectif et méthodes

L’objectif de cette thèse est de trouver des solutions pour permettre aux entreprises d’exposer des données de manières interopérable. L’interopérabilité des données désigne la capacité des systèmes informatiques et des logiciels à échanger, à comprendre et à utiliser les données d’autres systèmes de manière cohérente.

Pour assurer cet objectif nous allons explorer les possibilités d’un format de données intermédiaire, c’est à dire un formatage des données, du côté des SI, sous une forme tel qu’une fois exposé, interopérabilité avec d’autres services est possible. Nous pourrions aussi accepter des solutions externes servant d’agrégateur de données.

État de l’art

Le Web Sémantique

Le Web sémantique est une extension du web créée par le W3C, son but est de permettre à un ordinateur de comprendre et d’échanger des données provenant de différentes sources avec différents formats grâce à la mise en place d’un modèle unique: RDF. RDF est un format sous forme de graphe directionnel qui décrit les ressources web associées à nos données et les liens entre elles, ces relations sont un ensemble de « triplets », constitués d’un sujet, d’un prédicat et d’un objet qui sont respectivement la ressource décrite, un type de propriété applicable à cette ressource et la valeur de cette propriété qui peut être une autre resource23.

Selon le W3C Il serait aussi possible de mettre en place ce qu’ils appellent « l’interopérabilité sémantique ». Dans le framework RDF il est possible d’inscrire nos données dans une ontologie c’est à dire un ensemble de types, classes et sous-classes qui vont décrire les données. Le W3C explique donc dans un article4 que ces ontologies permettraient, si l’on suit quelques principes de permettre une interopérabilité des données.

Il existe notamment certaines ontologies qui sont mondialement utilisées comme le Dublin Core5 permettant de décrire des données bibliographiques, utilisée entre-autres part les Bibliothèques nationales de France, du Portugal, de Singapour, de la Corée du Sud et d’autres, ce qui leur permet d’avoir de l’interopérabilité.

Il semblerait aussi que RDF permettrait de traiter des données incomplètes dans un contexte d’interopérabilité selon une thèse publiée par l’école Normale Supérieure de Cachan6, ce qui donne du crédit à cette solution.

L’intelligence artificielle

RDF semble être l’option la plus prisée pour résoudre ce ce problème, cependant il existe quelques papiers qui envisagent d’autres solutions, comme celle évoquée une thèse écrite par Jacob Nilsson, travaillant à l’Université de technologie de Luleå. Ce dernier propose un modèle de machine learning permettant à deux signaux, sous format JSON mais sans le même schéma, d’être interprété correctement malgré leur différence7, il prend dans son papier l’exemple de deux capteurs ayant un schema de données différent, que son modèle arrive à interpréter.

Bibliographie

Abbreviations et sigles

DSL - Domain Specific language LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier OCDE - Organisation de coopération et de développement économiques RDF - Resource Description Framework W3C - World Wide Web Consortium

Sources

Footnotes

  1. OECD (2021), Data portability, interoperability and digital platform competition, OECD Competition Committee Discussion Paper, http://oe.cd/dpic

  2. Resource Description Framework (RDF) - W3C (https://www.w3.org/RDF/)

  3. Benjamin Moreau. Facilitating Reuse on the Web of Data. Data Structures and Algorithms [cs.DS]. Université de Nantes - Faculté des Sciences et Techniques, 2020. English. NNT : . tel-03155006

  4. Semantic Integration & Interoperability Using RDF and OWL - W3C (https://www.w3.org/2001/sw/BestPractices/OEP/SemInt/)

  5. Dublin Core - BNF (https://www.bnf.fr/fr/dublin-core)

  6. Cristina Sirangelo. Representing and Querying Incomplete Information: a Data Interoperability Perspective. Databases [cs.DB]. Ecole Normale Supérieure de Cachan, 2014. tel-01092547

  7. Jacob Nilsson - Machine Learning Concepts for Service Data Interoperability. Thèse de Luleå University of Technology 2022