Construire un moteur d'indexation
Nous présentons ici un moteur d'indexation ayant fait l'objet d'un transfert technologique entre l'université et l'industrie. Ce moteur est actuellement intégré dans des applications utilisées par les organisations internationales. Les corpus indexés sont volumineux et multilingues. En partant des spécificités du cahier des charges, nous examinons les choix d'architecture et de technologies effectués pour répondre aux contraintes de performance et de volumétrie. L'utilisation optimale des ressources de mémoire, de calcul et de stockage est discutée. Le séquençage et la parallélisation des processus sont examinés.
We present here an indexing engine which is covered by a technology transfer agreement between the University and the private sector. This engine is currently included in various applications used by international organizations. The document collections which are indexed are large and multilingual. The particular elements of the technical specifications are the starting point of our analysis; then we look at the design and technology choices made to meet the performance and volume constraints. The optimal use of memory, calculation and storage resources is discussed. The serialization and parallelization of processes are analyzed.
Jacques GUYOT, Gilles FALQUET, Karim BENZINEB
indexation, document, performance, architecture.
indexing, document, performance, design.
Français
|