ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 19/3 - 2014  - pp.107-136  - doi:10.3166/isi.19.3.107-136
TITRE
Diversité dans la recherche d’entités

TITLE
Diversification of entity search results

RÉSUMÉ
De nombreuses sources de données telles que les forums de discussion et les articles de journaux portent sur un sujet particulier et sont écrites autour d’entités nommées (personne, pays...). Pour ce type de sources, il est plus pertinent d’interpréter les requêtes des utilisateurs en utilisant les entités qu’elles contiennent et d’organiser les résultats par entités que de retourner une liste ordonnée de documents. Dans cet article, nous nous intéressons à cette problématique qui est également motivée par l’apparition des systèmes d’annotation automatique tels qu’Open Calais. Notre proposition est de permettre différentes interprétations des requêtes en utilisant des entités relatives. Un aspect particulier à cette problématique est la multitude de types d’entités (ex., Washington interprétée comme une ville ou une personne) et de catégories de documents (ex., Politique, Médecine). Nous proposons alors une diversification par types et catégories des résultats classés de chaque entité trouvée pour offrir à l’utilisateur une variété d’interprétations et une pertinence des résultats. Nos index permettent le passage à l’échelle de différentes interprétations de requêtes. Ce travail est le premier qui propose un modèle et des algorithmes pour la recherche diversifiée d’entités basée sur les annotations de documents.


ABSTRACT
Data sources such as forums and news articles focus on a particular subject and are written about entities (person, country, etc.). For such sources, it is more appropriate to interpret user queries using entities that the sources contain and organize the results by entity. In this paper, we present this problematic, which is also motivated by the existence of automatic annotation systems such as Open Calais. An interesting and particular feature is the multitude of types of entities (e.g., Washington interpreted as a city or a person) and categories of documents (e.g., Politics, Medicine). We then propose a diversification by types and categories for ranked results of each entity to offer to the user a variety of interpretations and relevance of the results. Our proposal is to index the necessary information that allows the scalability and to interpret different types of queries by related entities. This work is the first to propose a model and algorithms to diversify entities using annotations.


AUTEUR(S)
Imène SAIDI, Sihem AMER-YAHIA, Safia NAIT BAHLOUL

MOTS-CLÉS
recherche d’entités, diversité, recherche d’information, indexation de corpus.

KEYWORDS
entity search, diversity, information retrieval, indexing corpora.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (907 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier