ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 13/6 - 2008  - pp.61-84  - doi:10.3166/isi.13.6.61-84
TITRE
Fonctions d'agrégation pour l'analyse en ligne (OLAP) de données textuelles. Fonctions TOP_KWk et AVG_KW opérant sur des termes

RÉSUMÉ
Depuis plus de dix années, les recherches sur OLAP et les bases de données multidimensionnelles (BDM) ont généré des méthodologies, des outils et des moyens d'analyse de données numériques. Avec la disponibilité croissante des documents textuels électroniques, il est nécessaire d'incorporer des documents principalement constitués de données textuelles au sein de BDM ainsi que de proposer un environnement adapté pour leur analyse. Cet article décrit de nouvelles fonctions d'agrégation qui permettent d'agréger des données textuelles au sein de l'environnement OLAP. D'un côté, la fonction TOP_KEYWORD (ou TOP_KW) résume un ensemble de documents par leurs termes les plus significatifs. D'un autre côté, la fonction AVERAGE_KEYWORD (ou AVG_KW) tente de résumer des ensembles de mots-clefs par des mots-clefs plus généraux tout en permettant un contrôle sur la perte de sens imposée par le processus d'agrégation.


ABSTRACT
For more than a decade, researches on OLAP and Multidimensional DataBases (MDB) have generated methodologies, tools and resource management systems for the analysis of numerical data. With the growing availability of digital documents, there is a need for incorporating text-rich documents within multidimensional databases as well as an adapted framework for their analysis. This paper presents new aggregation functions that allow aggregating textual data within the OLAP environment. On the one hand, the TOP_KEYWORD function (TOP_KW for short) summarises a set of documents by their most significant terms. On the other hand, the AVERAGE_KEYWORD (AVG_KW for short) attempts to summarise sets of keywords by more general terms while controlling the loss of sense implied by this aggregation.


AUTEUR(S)
Geneviève PUJOLLE, Franck RAVAT, Olivier TESTE, Ronan TOURNIER

MOTS-CLÉS
OLAP, entrepôt de données, fonction d'agrégation, entrepôt de documents, mesure non additive, mesure textuelle.

KEYWORDS
OLAP, data warehouse, aggregation function, document warehouse, non-additive measure, textual measure.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (1,14 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier