Treillis de concepts et ontologies pour interroger l'annuaire de sources de données biologiques BioRegistry
Les sources de données biologiques disponibles sur le web aujourdhui sont
multiples et hétérogènes. Lutilisation optimale de ces ressources nécessite de la part des
utilisateurs des compétences à la fois en informatique et en biologie, à cause du manque de
documentation et des difficultés dinteraction avec les sources de données. De fait, les
contenus de ces sources de données restent souvent sous-exploités. Nous présentons ici une
approche qui sappuie sur lanalyse de concepts formels, pour organiser et rechercher des
sources de données biologiques pertinentes pour satisfaire une requête donnée. Le travail
consiste à construire un treillis de concepts à partir des métadonnées associées aux sources.
Le concept construit à partir dune requête donnée est alors classifié dans le treillis. La
réponse à la requête est ensuite fournie par lextraction des sources de données appartenant
aux extensions des concepts subsumant le concept requête dans le treillis. Les sources ainsi
retournées peuvent être triées selon lordre de spécificité des concepts dans le treillis. Une
procédure de raffinement de requête, sappuyant sur des ontologies de domaines, permet
daméliorer le rappel par généralisation ou par spécialisation.
Bioinformatic data sources available on the Web are multiple and heterogenous.
The lack of documentation and the difficulty of interaction with these data sources require
users competence in both informatics and biological fields for an optimal use of sources
contents that remain rather under exploited. In this paper we present an approach based on
formal concept analysis to classify and search relevant bioinformatic data sources for a
given query. It consists in building the concept lattice from the binary relation between
bioinformatic data sources and their associated metadata. The concept built from a given
query is then merged into the concept lattice. The result is given by the extraction of the set of
sources belonging to the extents of the query concept subsumers in the resulting concept
lattice. The sources ranking is given by the concept specificity order in the concept lattice. An
improvement of the approach consists in automatic query refinement thanks to domain
ontologies. Two forms of refinement are possible by generalisation and by specialisation.
N.MESSAI, M.DEVIGNES, A.NAPOLI, M.SMAÏL-TABBONE
métadonnées, bioinformatique, treillis de concepts, ontologies, sources de données
metadata, bioinformatics, concepts lattices, ontologies, data sources
Français
|