ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 6/3 - 2001  - pp.61-86
TITLE
Integration of biological data on transcriptome

RÉSUMÉ

De nouvelles techniques d’analyse biologique, dites "à haut débit" génèrent une masse considérable de données. L’unité de recherche U522 de l’INSERM, utilisant ces techniques pour l’étude du transcriptome hépatique, a initié le développement d’un environnement intégré nommé Gedaw (Gene Expression DAta Warehouse), pour la gestion et l’analyse de ces nombreuses données. Entrepôt de données orienté objet, il regroupe des connaissances et des données complexes sur les gènes du foie. Le concept d’ontologie, au centre de l’application, permet d’intégrer à la fois les données sur les séquences génomiques issues des banques de données publiques, et les données issues des expériences du laboratoire et des relevés cliniques. Cet article présente la problématique de l’intégration des données biologiques liées au transcriptome et les traitements pour : (i) intégrer les données génomiques à partir de banques publiques (telles que GenBank) (ii) extraire les informations pertinentes par sélection d’objets au format XML (iii) les rendre persistantes dans l’entrepôt.

ABSTRACT

A major concern in modern biology and medical research consists of the use of a “high flow” technology named bio-arrays or DNA chips that allows the study of thousands of genes simultaneously. The medical research institute, INSERM U522 uses the transcriptome techniques to diagnose liver disease states and to point the way towards new therapies. The design of a bioinformatic integrated environment, named Gedaw (Gene Expression DAta Warehouse) has been initiated for storing, managing and analyzing such specific data. As an object-oriented data warehouse, it includes knowledge and complex data on genes. The concept of ontology is the keystone of the application for integrating both genomic data available on public databanks, as well as experimental data on genes delivered from laboratory experiments and clinical statements. This paper describes the data modeling and processing that allow (i) to capture data from public databanks on genes (e.g., GenBank) (ii) to extract relevant information by selecting objects imported in XML format (iii) to make them persistent into the warehouse.

AUTEUR(S)
Laure BERTI-EQUILLE, Fouzia MOUSSOUNI, Anne ARCADE

MOTS-CLÉS
intégration, données biologiques, ontologie, entrepôt de données objet, XML, transcriptome.

KEYWORDS
data integration, biological data, ontology, object-oriented data warehouse, XML, transcriptome.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (3,47 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier