ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 8/5-6 - 2003  - pp.127-151  - doi:10.3166/isi.8.5-6.127-151
TITRE
Comparaison et fusion de structures logiques de documents semi-structurés

RÉSUMÉ
De nos jours, les documents constituent une mine de connaissances d'une importance capitale pour les entreprises. Afin d'exploiter ces informations documentaires, nous avons introduit le concept d'entrepôts de documents et proposé un modèle générique permettant le stockage des documents et leur classification selon des structures logiques génériques (arborescences ordonnées et étiquetées) adaptatives et non prédéfinies. L'alimentation d'un entrepôt de documents s'effectue en trois phases : extraction de la structure logique du document à insérer, comparaison de cette structure avec les structures génériques de l'entrepôt et insertion du document. L'objet de ce papier est de présenter notre méthode de comparaison de structures logiques de documents semi-structurés. Cette comparaison est basée sur la définition d'un processus de calcul de similarité d'arborescences hétérogènes d'éléments ordonnés et étiquetés. Il s'agit en particulier de spécifier les opérations de fusion de schémas (structures logiques) pouvant être réalisées.


ABSTRACT
Nowadays, the documents constitute a major element for the development of companies. In order to exploit the documentary information, we propose the concept of textual warehouses allowing the storage of documents and their classification according to adaptive and non predefined generic logical structures (ordered and labelled tree structures). The textual warehouse alimentation is based on three steps: logical structure extraction of the document to be integrated, comparison of this structure with the warehouse generic logical structures and insertion of the document. This paper describes our comparison method of logical structures of semi-structured documents. This comparison is based on the definition of a similarity computing process of heterogeneous tree structures of ordered and labelled elements. In particular, we specify the fusion operation of tree structures (logical structures).


AUTEUR(S)
Kaïs KHROUF, Franck RAVAT, Chantal SOULÉ-DUPUY

MOTS-CLÉS
documents semi-structurés, structures arborescentes, processus de comparaison et de fusion, distance d'alignement, degré de similarité.

KEYWORDS
semi-structured documents, tree structures, comparison and fusion process, alignment distance, similarity degree.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (294 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier