Utilisation de la plateforme QBox pour l’évaluation de la qualité dans les systèmes d’intégration de données
Using the QBox platform to assess quality in data integration systems
Une large collection d’outils commerciaux et open source disponibles sur le marché est proposée pour gérer les problèmes de qualité des données dans les systèmes d’information. Chacun de ces outils fournit des fonctionnalités spécifiques, et a sa propre vision de la qualité des données, mais ne suffit pas à répondre aux vastes besoins des utilisateurs. D’un côté, faire interagir ces outils entre eux demeure un défi technique en raison de l’hétérogénéité de leurs modèles et méthodes d’accès. D’un autre côté, les analystes de la qualité exigent de plus en plus de facilité d’intégration, leur permettant de consolider et de regrouper plusieurs mesures de qualité acquises et provenant de différentes observations. La QBox est une plateforme qui vise à répondre aux besoins cités ci-dessus en fournissant (i) un métamodèle générique qui permet de définir des objectifs et des métriques de qualité (ii) une infrastructure d’intégration à base de services qui permet l’interopérabilité de plusieurs outils de qualité (iii) une analyse et une visualisation multidimensionnelle des mesures effectuées basées sur OLAP. Cet article décrit ces trois composants, dont l’usage est démontré à travers un scénario d’intégration de données.
The data quality market is characterized by a sparse offer of tools, providing specific functions that have their own interest but are not sufficient to deal with broader user’s requirements. Interoperating among these tools remains a technical challenge because of the heterogeneity of their models and access patterns. On the other side, quality analysts require more and more integration facilities that allow them to consolidate and aggregate multiple quality measures acquired from different observations, using different tools. The QBox platform aims at filling this gap by supplying (i) a generic meta-model that supports the definition of quality goals and metrics, (ii) a service-based infrastructure that allows interoperability among several quality tools and (iii) an OLAP-based quality model to support multidimensional analysis and visualization. This paper describes these three components whose usage is illustrated using a data integration scenario.
F.LEMOS, M.BOUADJENEK, M.BOUZEGHOUB, Z.KEDAD
qualité des données, approche GQM, architecture orientée services, visualisation et analyse multidimensionnelle.
data and information quality, goal-question-metric approach, service-oriented architecture, OLAP design and visualization.
Anglais
|