mardi 26 août 2008

Nouvelle fournée 2008 des analyses de solutions MDM

Comme chaque année, l'été fournit ses nouveaux millésimes d'analyses de solutions MDM...

Gartner
Fait marquant cette année, l'apparition d'une seule et même analyse des solutions de Master Data Management, déclinée suivant les 2 problématiques que sont la gestion des données Client, et la gestion des données Produit, en lieu et place des 2 Magic Quadrants distincts des solutions - respectivement - de CDI (Customer Data Integration) et de PIM (Product Information Management).

Certes l'analyse n'a rien de radicalement nouveau tant au niveau des critères de sélection qu'au niveau des éditeurs étalonnés, mais l'approche a tout de même le mérite d'être citée : le MDM résultant de la prise de conscience de pratiques communes dans la gestion de données de référence de différentes natures, les solutions MDM (adressant ces problématiques de manière transverse) se devaient d'avoir leur propre quadrant magique.

A noter également la sortie du quadrant magique de solutions DQM, partenaires indissociables des démarches MDM réussies...

Forrester
Forrester récidive également (pourtant sans édition 2007...) avec son non moins attendu Wave sur les solutions de Hub Client. Le cabinet fait l'éloge des solution Hub Client, saluant leur montée en maturité (alors que le dernier Wave en date dénonçait l'état général de non maturité des solutions) et annonce leur avenir flamboyant là où en vingt ans d'efforts les datawarehouse, les CRM, les ERP et même la BI - prédit Forrester - ont ou vont inexorablement échouer dans la prise en main de la gestion des données Client.
Les habitués sont toujours dans la course : Initiate Systems, Siperian, IBM, Oracle ou encore D&B Purisma. Et parmi les faits marquants, on notera l'entrée remarquée de la solution MDM Suite de Sun dans le palmarès (elle même présente dans l'analyse de Gartner).

Loin de la représentativité du marché français ?
On regrettera néanmoins une fois de plus que les critères de sélection choisis - aussi bien chez Gartner que chez Forrester - écartent de l'analyse des solutions MDM pourtant dignes d'intérêt, voire pleines de potentiel de croissance et qui plus est installées dans l'Hexagone, parce que trop peu implantées dans le reste du monde, et donc quasi inconnues du panel de sociétés retenues...

Liens :

lundi 11 août 2008

Perspectives : MDM et sémantique

IBM Research a annoncé en janvier dernier le lancement du projet Semantic Master Data Management (SMDM) qui vise à utiliser les technologies Web sémantique pour outiller l'interrogation et l'analyse sémantique de données de référence. Cette technologie vise à terme à améliorer l'utilisation des données en référence en se greffant aux solutions MDM existantes.

Quelle opportunités apportent l'emploi de ces technologies récentes en entreprise, alors qu'elles semblent à priori cantonnées au stade d'expérience ? Quels avantages pourrait tirer le MDM, et plus globalement l’entreprise de ces technologies Web sémantique ?

Vous avez dit « Web sémantique » ?

Les technologies Web sémantiques regroupent les standards définis par le W3C pour donner du sens aux contenus Web : basés sur XML, URI et Unicode, les spécifications RDF (description de metadonnées), OWL (représentation d'ontologies) et autres SKOS (taxonomies, thésaurus) et SPARQL (requête pour RDF) sont autant de standards qui permettent la représentation des ontologies, la mise en relations de ressources pour construire liens et métadonnées, la définition de taxonomies et de vocabulaires, et la déduction automatique et l’interrogation de ces données et relations. A titre d'exemple, l’une des formes les plus répandues de l’utilisation de ces standards est le flux RSS, basé sur RDF.

Le "cake" des technologies Web sémantique

Au-delà de leur vocation première d’application aux ressources distribués sur le Web, ces standards XML s’appliquent à toute ressource identifiable - données, services, systèmes – et par conséquent en entreprise.

Adoption des technologies sémantiques
Les technologies sémantiques s’avèrent pertinentes en entreprise dans des contextes bien spécifiques : complexité des données (structures, sources, volumes), volatilité des données, ou encore volonté forte d’innovation et d’expérimentation.

Alors que les standards Web sémantiques étaient dans l’attente d’acteurs majeurs permettant de démocratiser leur adoption, Yahoo! a lancé en début 2008 la course à la gestion sémantique des contenus Web - prenant de cours Google en adoptant les standards du Web sémantique pour améliorer la pertinence des résultats de son moteur de recherche, espérant ainsi attirer plus d’utilisateurs et accroître les revenus publicitaires associés. Effet d’annonce ou véritable révolution, le domaine des données d’entreprise n’est pas en reste puisque les technologies sémantiques s’y trouvent également en cours d’adoption.

Plusieurs démarches sont en cours dans plusieurs secteurs d’activités : santé, marchés financiers, médias interactifs, aérospatiale et défense, et d’autres secteurs s’y intéressent également de près, comme l’assurance, la chimie/pétrochimie, le tourisme, le transport et l’électronique, etc. (Source : Semantic Web Industry Adoption, Yue Pan). En témoignent les spécifications de normes, de taxonomies et de vocabulaires spécifiques communs : UMLS Semantic Network et HL7 CTS pour le secteur de la santé, XBRL Taxonomy & Linkbase pour la finance, Dublin Core et autres RSS pour les médias.

Pourquoi utiliser des ontologies ?
Le projet SMDM a fait le choix de gérer des ontologies enrichies à partir du modèle de données logique d’une solution MDM.

Architecture de la solution SMDM, basée sur une solution MDM Hub (source : IBM)

Pour mémoire, l’ontologie est concept fondamental du Web sémantique, pouvant être définie comme la spécification explicite d’une conceptualisation partagée. Il s’agit donc d’une structure clé pour la représentation des connaissances.

Les données maîtres sont représentées sous formes d’instances d’ontologies de la forme <sujet, prédicat, objet>, similaire au langage naturel et aisément interprétable.

Après la mise en place de l’entrepôt d’ontologies, celle des moteurs de recherche associés : le langage de requête SPARQL permet l’interrogation de ces données, les requêtes étant intuitivement construites sans qu’il ne soit nécessaire d’avoir connaissance du modèle de données sous-jacent.

L’utilisation d’ontologies permet également la découverte d’informations implicites par le biais du raisonnement ontologique : découvertes de nouvelles relations, classification automatique, mise en relations automatiques, catégorisation à la volée (voir encadré).


Avantages des ontologies OWL pour les informations Produit
(source : IBM)
  • Identification des ressources
    Basé sur RDF, OWL utilise le concept d’identification universelle de ressources (URIs, Universal Resources Identifiers) comme schéma d’identification basé sur le Web. Ceci permet tout d’abord de faire référence aux ontologies spécifiques d’entreprise ou bien externes. Ensuite, cela permet la synchronisation des outils de gestion de données produit avec les autres entités métiers, comme ceux de la gestion des données Client (CDI, pour Customer Data Integration).
  • Propriétés et relations plus riches
    OWL permet la définition de propriétés et de relations plus riches. Les propriétés d’objets peuvent être définis comme symétriques, fonctionnelles, fonctionnelles inverses ou transitives. Les propriétés d’objet sont ensuite adaptées à la description de relations complexes parmi les produits, entre produits et toute autre entité dans les informations produit.
  • Classification automatique
    L’expressivité d’OWL permet la définition de classes logiques (intersection, union et opérateurs complémentaires), qui permet la classification automatique d’instances de produits. En effet, de nouvelles catégories de produits peuvent être définies comme l’intersection de deux autres : les smartphones, qui héritent à la fois des caractéristiques des PDA et des téléphones, sont un bon exemple. Tout produit étant simultanément un PDA et un téléphone est alors un smartphone.
  • Déduction automatique et catégorisation à la volée
    Les restrictions d’OWL peuvent définir des catégories dynamiques qui n’existaient pas dans la hiérarchie prédéfinie des catégories, et qui peuvent être spécifiée par les utilisateurs lors de la requête. Celles-ci permettent de représenter des catégories complexes et potentiellement évolutives. Par exemple, utiliser la restriction des cardinalités minimales, il est possible de définir une catégorie « produits obsolètes » qui rassemble l’ensemble des produits remplacés par au moins un autre. Les éléments de catégories dynamiques peuvent être extraits en utilisant le raisonnement d’ontologie OWL.

Nouvelles fonctionnalités pour la gestion des données produit (source : IBM)

Vers une maîtrise globale du capital informationnel de l’entreprise
Les solutions MDM et de gestion de contenu actuelles maintiennent elles-mêmes leurs propres métadonnées, et de ce fait l’entreprise reste tributaire des choix (trop souvent propriétaires) effectués par chaque éditeur. Ces silos de métadonnées sont un obstacle pour l’entreprise à l'accès à une compréhension globale et transverse de ses données stratégiques, structurées ou non structurées.

Par la construction d’un socle sémantique utilisant les standards W3C au dessus de ses entrepôts de données, l’entreprise se dote des moyens lui offrant de nouveaux usages pour l’exploitation des contenus métiers, par la capacité à valoriser l’ensemble de ses données stratégiques en véritables informations.
Alors que la sémantique permet la compréhension, la déduction automatique et l'interrogation intelligente des données, les standards sémantiques ajoutent l’interopérabilité inter-applicative : les outils d’analyse ont accès à toujours plus de contenu intelligible; les règles métiers peuvent s’affiner et perfectionner la gouvernance des données, la déduction automatique permet la mise en relation de données toujours plus hétérogènes, et l’interrogation sur ces données devient plus pertinente, offrant ainsi une meilleure maîtrise des actifs informationnels de l’entreprise.

Même s'il s'agit encore d'un sujet naissant, difficile d'appréhension et peu répendu - les éditeurs OWL à l'instar de Protégé sont encore peu connus - , l’émergence du courant d’adoption de ces standards sémantiques en entreprise est bien la preuve que l’EIM (Enterprise Information Management) est loin d’avoir dit son dernier mot…

Liens :

jeudi 7 août 2008

MDM et Open Source

Le site ebizQ vient de publier un article de Dennis Byron recensant les initiatives MDM dans le monde Open Source (communauté Mural dirigée par Sun, et MetaMatrix par RedHat), posant la question de la place de l'Open Source dans le paysage des solutions MDM.

Liens :