ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 13/5 - 2008  - pp.59-82  - doi:10.3166/isi.13.5.59-82
TITLE
Improving quality and performance of schema matching in large scale

RÉSUMÉ
La découverte de correspondances entre schémas est une étape importante lorsque l'on intègre des informations d'un même domaine. Cependant, ce processus est encore trop souvent effectué manuellement ou au moyen d'approches semi-automatiques. Notre approche Bmatch s'appuie sur une combinaison de mesures terminologiques et d'informations contextuelles pour découvrir des correspondances entre schémas. Par ailleurs, pour être efficace dans un contexte large échelle, nous nous appuyons sur une structure d'indexation Btree pour réduire l'espace de recherche. Des expérimentations sur des données réelles montrent que notre approche passe bien à l'échelle tout en obtenant globalement une meilleure qualité et de meilleures performances comparativement aux outils de découverte de correspondances de référence.


ABSTRACT
Schema matching is a crucial task to gather information of the same domain. However, this process is still largely performed manually or semi-automatically, discouraging the deployment of large-scale mediation systems. Indeed, these large-scale scenarii need a solution which ensures both an acceptable matching quality and good performance. In this article, we present the BMatch approach to efficiently match a large number of schemas. The quality aspect is based on the combination of terminological and contextual methods. The performance aspect relies on a B-tree indexing structure to reduce the search space. Finally, experiments with real sets of schemas show that our approach is scalable and outperforms the most referenced matching tools both in quality of matches and performance time.


AUTEUR(S)
Fabien DUCHATEAU, Zohra BELLAHSENE, Mathieu ROCHE

MOTS-CLÉS
similarité semantique, découverte de correspondances entre schmémas, BMatch, structure d'indexation B-tree, contexte d'un noeud, mesures terminologiques et structurelles.

KEYWORDS
semantic similarity, schema matching, BMatch, B-tree index structure, node context, terminological and structural measures.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (443 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier