ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 9/3-4 - 2004  - pp.133-159  - doi:10.3166/isi.9.3-4.133-159
TITRE
Extraction de motifs séquentiels fréquents sous contraintes dans des données contenant des répétitions consécutives

RÉSUMÉ
L'extraction de motifs séquentiels sous contraintes est un domaine de recherche actif lié à de nombreuses applications. En pratique, les bases de données de séquences peuvent présenter des répétitions consécutives de symboles (e.g. les séquences ADN) qui provoquent une surconsommation de ressources. Pour remédier à ce problème, nous proposons un algorithme d'extraction sous contraintes capable de compacter ces répétitions. La technique introduite dans cet article permet de conserver les avantages des algorithmes existants basés sur les listes d'occurrences tout en permettant d'étendre leur champ d'application aux jeux de données contenant des répétitions consécutives. Nous analysons les bénéfices obtenus en utilisant des jeux de données synthétiques et nous montrons que cette approche présente un intérêt pratique dans le cas de jeux de données réels.


ABSTRACT
Constraint-based mining of sequential patterns is an active research area motivated by many application domains. In practice, the real sequences datasets can present consecutive repetitions of symbols (e.g., DNA sequences) that can lead to a resource overhead during the extraction of patterns. We propose a constraint-based mining algorithm using an approach that compacts these consecutive repetitions. The technique introduced in this paper allows to keep the advantages of existing state-of-the-art algorithms based on the notion of occurrence lists, while permitting to extend their application fields to datasets containing consecutive repetitions. We analyze the benefits obtained using synthetic datasets, and show that the approach is of practical interest on real datasets.


AUTEUR(S)
Marion LELEU, Nicolas MÉGER, Christophe RIGOTTI

MOTS-CLÉS
séquences d'événements, motifs séquentiels contraints, occurrences généralisées.

KEYWORDS
event sequences, constrained sequential patterns, generalized occurrences.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (263 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier