ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 21/1 - 2016  - pp.81-102  - doi:10.3166/isi.21.1.81-102
TITRE
Réduction du nombre des prédicats pour les approches de répartition des entrepôts de données

TITLE
Reducing the number of predicates for approaches to distribution of data warehouses

RÉSUMÉ
Dans le domaine des entrepôts de données, la plupart des approches de répartition se basent essentiellement sur les techniques de fragmentation et d’allocation des tables. Ces approches exploitent communément en entrée les prédicats extraits des requêtes OLAP les plus utilisées dans le processus de partitionnement. Étant donné que le nombre de prédicats est en augmentation continue, et vu l’impact négatif qu’engendre cette augmentation sur le nombre de partitions générées, il devient intéressant de le réduire avant de procéder au processus de fragmentation. Dans cet article, nous proposons une solution basée sur un algorithme de classification permettant de diminuer le nombre des prédicats pour les approches de répartition des entrepôts de données. La solution proposée englobe quatre phases : la sélection préliminaire des prédicats, la codification des prédicats sous forme de matrices binaires, la classification de ces prédicats par l’algorithme k-means et une phase finale pour la réduction du nombre de prédicats. Nous avons validé notre solution sur un entrepôt de données réel issu du benchmark APB-1 et TPC-H.


ABSTRACT
In the domain of data warehousing, most approaches of distribution are essentially based on the techniques of fragmentation and allocation tables. These approaches exploit in input extracts predicates of OLAP queries most used in the partitioning process. Since continues increase of the number of predicates, and her negative impact, it becomes more and more interesting to reduce this increase before the fragmentation process. In this paper, we propose a solution based on a classification algorithm to reduce the number of predicates in the data warehouses allocation approaches. The proposed solution encompasses for phases: a preliminary phase for predicates selection, a predicates coding phase as binary matrices, a classification phase of these predicates using the k-means algorithm and a final phase to 82 ISI. Volume 21 – n° 1/2016 reduce the number of predicates. We validate our solution on a real data warehouse basing on the APB1 and TPC-H benchmarks.


AUTEUR(S)
Mourad GHORBEL, Karima TEKAYA, Abdelaziz ABDELLATIF

MOTS-CLÉS
entrepôt de données, classification, répartition.

KEYWORDS
data warehouse, classification, distribution.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (322 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier