Quelle opportunités apportent l'emploi de ces technologies récentes en entreprise, alors qu'elles semblent à priori cantonnées au stade d'expérience ? Quels avantages pourrait tirer le MDM, et plus globalement l’entreprise de ces technologies Web sémantique ?
Vous avez dit « Web sémantique » ?
Les technologies Web sémantiques regroupent les standards définis par le W3C pour donner du sens aux contenus Web : basés sur XML, URI et Unicode, les spécifications RDF (description de metadonnées), OWL (représentation d'ontologies) et autres SKOS (taxonomies, thésaurus) et SPARQL (requête pour RDF) sont autant de standards qui permettent la représentation des ontologies, la mise en relations de ressources pour construire liens et métadonnées, la définition de taxonomies et de vocabulaires, et la déduction automatique et l’interrogation de ces données et relations. A titre d'exemple, l’une des formes les plus répandues de l’utilisation de ces standards est le flux RSS, basé sur RDF.
Le "cake" des technologies Web sémantique
Au-delà de leur vocation première d’application aux ressources distribués sur le Web, ces standards XML s’appliquent à toute ressource identifiable - données, services, systèmes – et par conséquent en entreprise.
Adoption des technologies sémantiques
Les technologies sémantiques s’avèrent pertinentes en entreprise dans des contextes bien spécifiques : complexité des données (structures, sources, volumes), volatilité des données, ou encore volonté forte d’innovation et d’expérimentation.
Alors que les standards Web sémantiques étaient dans l’attente d’acteurs majeurs permettant de démocratiser leur adoption, Yahoo! a lancé en début 2008 la course à la gestion sémantique des contenus Web - prenant de cours Google en adoptant les standards du Web sémantique pour améliorer la pertinence des résultats de son moteur de recherche, espérant ainsi attirer plus d’utilisateurs et accroître les revenus publicitaires associés. Effet d’annonce ou véritable révolution, le domaine des données d’entreprise n’est pas en reste puisque les technologies sémantiques s’y trouvent également en cours d’adoption.
Plusieurs démarches sont en cours dans plusieurs secteurs d’activités : santé, marchés financiers, médias interactifs, aérospatiale et défense, et d’autres secteurs s’y intéressent également de près, comme l’assurance, la chimie/pétrochimie, le tourisme, le transport et l’électronique, etc. (Source : Semantic Web Industry Adoption, Yue Pan). En témoignent les spécifications de normes, de taxonomies et de vocabulaires spécifiques communs : UMLS Semantic Network et HL7 CTS pour le secteur de la santé, XBRL Taxonomy & Linkbase pour la finance, Dublin Core et autres RSS pour les médias.
Pourquoi utiliser des ontologies ?
Le projet SMDM a fait le choix de gérer des ontologies enrichies à partir du modèle de données logique d’une solution MDM.
Architecture de la solution SMDM, basée sur une solution MDM Hub (source : IBM)
Pour mémoire, l’ontologie est concept fondamental du Web sémantique, pouvant être définie comme la spécification explicite d’une conceptualisation partagée. Il s’agit donc d’une structure clé pour la représentation des connaissances.
Les données maîtres sont représentées sous formes d’instances d’ontologies de la forme <sujet, prédicat, objet>, similaire au langage naturel et aisément interprétable.
Après la mise en place de l’entrepôt d’ontologies, celle des moteurs de recherche associés : le langage de requête SPARQL permet l’interrogation de ces données, les requêtes étant intuitivement construites sans qu’il ne soit nécessaire d’avoir connaissance du modèle de données sous-jacent.
L’utilisation d’ontologies permet également la découverte d’informations implicites par le biais du raisonnement ontologique : découvertes de nouvelles relations, classification automatique, mise en relations automatiques, catégorisation à la volée (voir encadré).
Avantages des ontologies OWL pour les informations Produit
(source : IBM)
(source : IBM)
- Identification des ressources
Basé sur RDF, OWL utilise le concept d’identification universelle de ressources (URIs, Universal Resources Identifiers) comme schéma d’identification basé sur le Web. Ceci permet tout d’abord de faire référence aux ontologies spécifiques d’entreprise ou bien externes. Ensuite, cela permet la synchronisation des outils de gestion de données produit avec les autres entités métiers, comme ceux de la gestion des données Client (CDI, pour Customer Data Integration). - Propriétés et relations plus riches
OWL permet la définition de propriétés et de relations plus riches. Les propriétés d’objets peuvent être définis comme symétriques, fonctionnelles, fonctionnelles inverses ou transitives. Les propriétés d’objet sont ensuite adaptées à la description de relations complexes parmi les produits, entre produits et toute autre entité dans les informations produit. - Classification automatique
L’expressivité d’OWL permet la définition de classes logiques (intersection, union et opérateurs complémentaires), qui permet la classification automatique d’instances de produits. En effet, de nouvelles catégories de produits peuvent être définies comme l’intersection de deux autres : les smartphones, qui héritent à la fois des caractéristiques des PDA et des téléphones, sont un bon exemple. Tout produit étant simultanément un PDA et un téléphone est alors un smartphone. - Déduction automatique et catégorisation à la volée
Les restrictions d’OWL peuvent définir des catégories dynamiques qui n’existaient pas dans la hiérarchie prédéfinie des catégories, et qui peuvent être spécifiée par les utilisateurs lors de la requête. Celles-ci permettent de représenter des catégories complexes et potentiellement évolutives. Par exemple, utiliser la restriction des cardinalités minimales, il est possible de définir une catégorie « produits obsolètes » qui rassemble l’ensemble des produits remplacés par au moins un autre. Les éléments de catégories dynamiques peuvent être extraits en utilisant le raisonnement d’ontologie OWL.
Nouvelles fonctionnalités pour la gestion des données produit (source : IBM)
Vers une maîtrise globale du capital informationnel de l’entreprise
Les solutions MDM et de gestion de contenu actuelles maintiennent elles-mêmes leurs propres métadonnées, et de ce fait l’entreprise reste tributaire des choix (trop souvent propriétaires) effectués par chaque éditeur. Ces silos de métadonnées sont un obstacle pour l’entreprise à l'accès à une compréhension globale et transverse de ses données stratégiques, structurées ou non structurées.
Par la construction d’un socle sémantique utilisant les standards W3C au dessus de ses entrepôts de données, l’entreprise se dote des moyens lui offrant de nouveaux usages pour l’exploitation des contenus métiers, par la capacité à valoriser l’ensemble de ses données stratégiques en véritables informations.
Alors que la sémantique permet la compréhension, la déduction automatique et l'interrogation intelligente des données, les standards sémantiques ajoutent l’interopérabilité inter-applicative : les outils d’analyse ont accès à toujours plus de contenu intelligible; les règles métiers peuvent s’affiner et perfectionner la gouvernance des données, la déduction automatique permet la mise en relation de données toujours plus hétérogènes, et l’interrogation sur ces données devient plus pertinente, offrant ainsi une meilleure maîtrise des actifs informationnels de l’entreprise.
Même s'il s'agit encore d'un sujet naissant, difficile d'appréhension et peu répendu - les éditeurs OWL à l'instar de Protégé sont encore peu connus - , l’émergence du courant d’adoption de ces standards sémantiques en entreprise est bien la preuve que l’EIM (Enterprise Information Management) est loin d’avoir dit son dernier mot…
Liens :
- Semantic Web technologies enhance enterprise Master Data Management
- Semantic Web Technologies and Data Management
- Explorations in the Use of Semantic Web Technologies for Product Information Management
- MDM is Not Enough - Semantic Enterprise is Needed
- Semantic Web Industy Adoption
- A CDI and MDM Are Broken, Part 2 - Application of semantic technologies to MDM applications, including CDI (Stephen Putman)
Excellent article sur une tendance qui a l'air d'être un vrai mouvement de fond, merci !
RépondreSupprimerEt la nouvelle présentation du blog, accompagnée d'une photo nouvelle version, est parfaite :-)