ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 7/1-2 - 2002  - pp.63-93  - doi:10.3166/isi.7.1-2.63-93
TITRE
Recherche d'information dans des corpus plurilingues

RÉSUMÉ
Dans cet article, nous décrivons comment concevoir des algorithmes de dépistage de l'information adaptés pour d'autres langues que l'anglais, et plus précisément pour le français, l'allemand, l'italien et l'espagnol. En effet, si plusieurs études ont proposé diverses approches pour la langue de Shakespeare, la morphologie des autres langues européennes présente une plus grande richesse dont les systèmes de dépistage devraient tenir compte. Les campagnes d'évaluation CLEF s'intéressent particulièrement à ces questions et elles ont permis la création de collections de documents en plusieurs langues. Sur la base de ces corpus, nous proposons différentes approches visant à éliminer les marques liées à la morphologie flexionnelle et dérivationnelle pour le français, l'allemand, l'italien et l'espagnol. En se basant sur dix stratégies de recherche, nous avons évalué ces stratégies afin de dégager quelques lignes directrices concernant l'importance de la morphologie en recherche d'information.


ABSTRACT
In this paper, we describe how to design a search engine for other languages than English, namely, French, German, Italian and Spanish languages. While in the past English has been the main language for information retrieval experiments, the morphology of most European languages involve more complex morphologies than does the English language and effective search engines must taken account of this phenomenon. The Cross-Language Evaluation Forum (CLEF) was founded to study and evaluate various multiple language information access technologies and has developed various non-English test-collections. Based on these corpora, this paper describes various approaches to remove both inflectional and derivational suffixes for the French, German, Italian and Spanish languages. Based on ten different retrieval schemes, we have carried out experiments showing the impact of the morphology for effective information retrieval.


AUTEUR(S)
Jacques SAVOY

MOTS-CLÉS
recherche d'information, morphologie, enracineur, indexation plurilingue.

KEYWORDS
information retrieval, morphology, stemming, multilingual indexing.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (397 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier