ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 19/5 - 2014  - pp.45-73  - doi:10.3166/isi.19.5.45-73
TITRE
Entrepôts de textes. Proposition d’un processus ETL et d’un modèle multidimensionnel TWM approprié

TITLE
Text warehousing. A proposed ETL process and multidimensional model TWM

RÉSUMÉ
Dans cet article, nous proposons une architecture décisionnelle pour l’entreposage des données textuelles. Notre approche comporte, d’une part, un nouveau processus d’intégration, d’alimentation et de rafraîchissement adaptés à l’entrepôt de textes que nous baptisons ETLText (Extract-Transform-Load-Text). Son objectif est de pallier les limites du processus ETL classique inadapté à l’intégration de données textuelles dans un système décisionnel. D’autre part, nous présentons TWM (Text Warehousing Model) comme un nouveau modèle multidimensionnel pour les entrepôts de textes. La spécificité de celui-ci est l’extension du modèle en constellation pour prendre en compte la complexité liée à la fois à la structure des données textuelles et à la sémantique qu’elles véhiculent. Notre approche s’appuie sur Wikipédia comme source externe de connaissances pour pouvoir associer à un texte, des concepts sémantiques et un ensemble de catégories y afférentes. Pour valider notre approche, nous avons développé des modules illustrant les étapes d’ETL-Text.


ABSTRACT
In this paper, we propose a decisional architecture for textual data warehousing. Our contribution is that firstly we propose a new methodology, denoted ETL-Text, to extract data from outside sources and then transform it to fit the text analysis and load it into the end target. Secondly, we present a new Text Warehousing Model denoted TWM which takes into account both the complexity of the textual data structure and their semantics. Moreover, our approach is based on Wikipedia as external knowledge source to extract the semantic of the textual documents. To validate our approach, we developed a prototype which is composed of modules in order to illustrate the ETL-Text steps.


AUTEUR(S)
Rachid AKNOUCHE, Omar BOUSSAID, Fadila BENTAYEB, Ounas ASFARI

MOTS-CLÉS
Entrepôts de textes, ETL-Text, Wikipédia, Modèle Multidimensionnel.

KEYWORDS
Text warehousing, ETL-Text, Wikipedia, Multidimensional Model.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (1,30 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier