ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 21/3 - 2016  - pp.31-52  - doi:10.3166/isi.21.3.31-52
TITRE
Une approche pour évaluer la complétude de données RDF

TITLE
An approach to evaluate RDF data completeness

RÉSUMÉ
Nous assistons depuis quelques années à une prolifération de données du web. Ceci a accéléré le développement d’application et de logiciels fondés sur l’exploitation et l’analyse des données. Il devient donc urgent de proposer des techniques et des méthodes pour l’évaluation et l’assurance de la qualité de ces données. La qualité est un concept multidimensionnel qui repose sur une variété de dimensions. Une des dimensions critiques pour la prise de décision est la complétude. Cette dimension est reconnue comme difficile à évaluer puisqu’elle requiert souvent l’existence d’une norme d’excellence ou un schéma de référence validé et agréé qui servira de référence universelle à cette complétude. Cependant un tel référentiel est rarement disponible voire inexistant dans la pratique. Dans le présent article, nous proposons une approche pour l’évaluation de la complétude de sources de données RDF (Resource Description Framework). L’approche est un processus en deux étapes. La première étape, que nous pouvons qualifier de fouille de schéma, consiste à extraire un schéma probable pour la description d’une source de données. Ce schéma est ensuite exploité lors de la deuxième étape du processus pour l’évaluation de la complétude. L’article présente, à la fois des concepts théoriques sur lesquels repose l’approche, mais aussi des expérimentations basées sur des données RDF réelles.


ABSTRACT
With the development of data based applications, data quality becomes a burning issue in the context of the Web of Data. Organizations as well as researchers need suitable methods and techniques to help ensuring web data quality along the whole process, from data transformation and publication to data querying and exploitation. Among quality dimensions, completeness is recognized as difficult to evaluate, as it often relies on gold standards and/or a reference schema that are neither always available nor realistic from a practical point of view. In this paper, we propose an approach for the assessment of RDF data completeness. The proposed solution consists, first, on inferring a schema using a frequent itemset mining approach, and second, on measuring the completeness regarding the inferred schema. The paper presents both theoretical background and experimental results performed on real-world RDF datasets.


AUTEUR(S)
Fayçal HAMDI, Samira SI-SAID CHERFI

MOTS-CLÉS
web de données, qualité des données RDF, complétude, évaluation de la qualité.

KEYWORDS
linked Data, RDF data quality, completeness, quality evaluation.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (252 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier