ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 7/1-2 - 2002  - pp.95-123  - doi:10.3166/isi.7.1-2.95-123
TITRE
Quand la réponse se trouve dans un grand corpus

RÉSUMÉ
Traiter des questions factuelles portant sur n'importe quel sujet dont la réponse appartient à un très large corpus entraîne l'application de processus de Traitement Automatique des Langues (TAL) afin de localiser la réponse dans les documents sélectionnés par un moteur de recherche. Le système QALC, présenté dans cet article, a participé à la tâche Question Answering lors des évaluations TREC8 et TREC9. QALC exploite les résultats d'une analyse des documents où les termes de la question traitée, ainsi que leurs variantes, sont étiquetés et pondérés. Ces éléments permettent de pondérer les documents afin de n'en sélectionner qu'une partie pour la suite des traitements. Par ailleurs, ils permettent aussi d'améliorer la sélection des phrases candidates lorsqu'elles sont comparées à une question afin de décider si elles sont susceptibles de contenir la réponse. Cette comparaison exploite également les résultats d'une analyse des questions indiquant le type de la réponse attendue, qui est rapproché du marquage, dans les phrases, des types d'entités nommées reconnues par le système.


ABSTRACT
Answering to open-domain factual questions requires to apply Natural Language treatments to retrieved documents in order to be able to locate the answers inside them. We developed a system, QALC, that participated to the Question Answering track of the TREC8 and TREC9 evaluations. QALC exploits an analysis of documents based on the search for multi-words terms and their variations both to select a minimal number of documents to be processed and to give indices when comparing question and sentence representations. This comparison also takes advantage of a question analysis module and a recognition of named entities in the documents.


AUTEUR(S)
Olivier FERRET, Brigitte GRAU, Martine HURAULT-PLANTET, Gabriel ILLOUZ, Christian JACQUEMIN

MOTS-CLÉS
système de question-réponse, extraction de terme, variante terminologique, entité nommée, recherche d'information.

KEYWORDS
Question answering system, term extraction, terminological variant, named entity, information retrieval.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (511 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier