ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 16/6 - 2011  - pp.139-162  - doi:10.3166/isi.16.6.139-162
TITRE
Entreposage et analyse en ligne dans les nuages avec Pig

TITLE
Pig-based data warehouses and on-line analysis in the cloud

RÉSUMÉ

Les entrepôts de données et les systèmes OLAP permettent d’analyser à la volée de gros volumes de données. L’informatique dans les nuages vise à proposer des capacités de calcul et de stockage virtuellement infinies. Considérer l’analyse et l’entreposage de données au sein des nuages informatiques devient alors un enjeu majeur. Les problèmes à aborder sont ceux classiques des systèmes largement distribués, mais sous un nouvel angle prenant en compte les spécificités de ce paradigme : facturation à l’utilisation, élasticité et facilité d’utilisation. Cet article aborde dans un premier temps les règles de facturation à l’utilisation pour le stockage des entrepôts de données. Nous proposons d’utiliser pour les nuages des techniques de stockage à base de tableaux multidimensionnels. Ensuite, nous nous intéressons à l’analyse OLAP en proposant de nouveaux opérateurs et des règles d’optimisation, dont l’intérêt est mis en avant par de premières expérimentations. Enfin, nous listons des perspectives de recherche pour la définition d’un cadre théorique et pratique pour l’entreposage et l’analyse en ligne dans les nuages.



ABSTRACT

Data warehouses and OLAP systems are decision support technologies for online analysis of large volumes of data. Cloud computing aims at supplying virtually infinite computing and storage resources. Considering OLAP analysis and data warehousing in the cloud becomes a major issue. The problems to be considered are those of conventional large scale distributed systems, but from a new point of view that takes into account the specificities of this paradigm: pay as you go model, elasticity and user-friendliness. This paper initially investigates data warehouse storage issues. We propose to use multidimensional arrays for the storage of cloud-based data warehouses. Then, we focus on OLAP analysis by proposing new operators and optimization rules, whose relevance is shown by initial experiments. Finally, we list research perspectives on the definition of a theoretical framework and implementation for multidimensional storage and online analysis in the clouds.



AUTEUR(S)
Laurent D'ORAZIO, Sandro BIMONTE

MOTS-CLÉS
entrepôts de données, OLAP, Cloud, Pig.

KEYWORDS
data warehouses, OLAP, Cloud, Pig.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (2,75 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier