ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 7/3 - 2002  - pp.67-88  - doi:10.3166/isi.7.3.67-88
TITLE
Getting right answers from incomplete multidimensional databases

RÉSUMÉ
Dans le contexte des OLAP, les valeurs manquantes au sein des données de détail influencent la qualité des agrégats d’un cube de données. En considérant que l’ensemble des valeurs non manquantes constitue un échantillon biaisé du vrai résultat de la requête, nous proposons une méthode d’ajustement des agrégats. En adaptant des méthodes classiques d’échantillonnage, nous montrons comment résoudre : (1) le cas de tuples manquants dans la base de données, (2) le cas de valeurs manquantes dans les attributs formant les dimensions d’un cube de données. La méthode d’ajustement est réalisée en intégrant un système de poids au sein du cube de données. Un algorithme (méthode ROWN) permet de déterminer les systèmes de pondération en minimisant leur nombre. Une implémentation sous ORACLE EXPRESS est finalement brièvement décrite.

ABSTRACT
Dealing with large volumes of data, OLAP data cubes aggregated values are often spoiled by errors due to missing values in detailed data. This paper suggests to adjust aggregate answers, noticing that non-missing values constitute a biased sample of the true result of the query. Using basic random sampling theory, we show that two different problems can be solved nicely: (1) the case of missing tuples in the database, (2) the case of missing values appearing in the attributes used to build the data cube dimensions. Integration of these concepts within the OLAP data cube model is solved, by adjusting the data cube measures with a well-chosen weighting system. An algorithm (the ROWN method) minimizes the number of necessary weighting systems. A proof of concept implementation on the ORACLE EXPRESS system is briefly described at the end of the paper.

AUTEUR(S)
Sabine GOUTIER, Georges HÉBRAIL, Véronique STÉPHAN

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (334 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier