ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 21/1 - 2016  - pp.61-80  - doi:10.3166/isi.21.1.61-80
TITRE
Analyse des tweets pour la détection des événements

TITLE
Tweets analysis for event detection

RÉSUMÉ
Les médias sociaux ont été révélés être des plates-formes utiles pour les publications informations et la communication, en particulier lors des événements; par exemple en cas de catastrophe naturelle comme les tremblements de terre, tsunami et dans les pays d’urgence nucléaire comme au Japon en 2011. Ce comportement conduit à une accumulation d’une énorme quantité d’informations. Cependant, pour trouver les messages pertinents peut être une tâche difficile, puisque la pertinence d’un poste dépend à la fois de son contenu, de l’auteur et des caractéristiques du tweet. Outre l’identification des tweets qui décrivent un type spécifique d’événement est aussi difficile en raison de la grande complexité et la variété des descriptions d’événements. Ces défis présentent une grande opportunité pour le traitement automatique du langage naturel (NLP) et la technologie de l’extraction d’information (IE) pour construire à grande échelle de nouvelles applications d’analyse de données. En tenant compte de toutes ces difficultés, cet article propose une nouvelle mesure pour améliorer les résultats des recherches dans les microblogs. Il combine la pertinence du contenu, la pertinence de l’auteur et la pertinence du tweet, et développe une méthode de traitement automatique des langages naturels pour extraire des informations temporelle des événements dans les messages plus spécifiquement tweets. Notre approche est basée sur une 62 ISI. Volume 21 – n° 1/2016   méthodologie des classes de marqueurs temporels et sur une méthode d’exploration contextuelle. Pour évaluer notre modèle, nous avons construit un système de gestion des connaissances. En fait, nous avons utilisé une collection de 10 mille tweets qui parlent de l’actualité entre 2014 et 2015.


ABSTRACT
Social media systems have been proven to be valuable platforms for information and communication, particularly during events; in case of natural disaster like earthquakes tsunami and states of nuclear emergencies in Japan in 2011. The behavior leads to an accumulation of an enormous amount of information. However, finding relevant posts can be a challenging task, since the relevance of a post is dependent both on its content, author and tweet’s characteristics. Besides identifying tweets that describe a specific type of event is also challenging due to the high complexity and variety of event descriptions. These challenges present a big opportunity for Natural Language Processing (NLP) and Information Extraction (IE) technology to enable new large-scale data-analysis applications. Taking to account all the difficulties, this paper proposes a new metric to improve the results of the searches in microblogs. It combines content relevance, tweet relevance and author relevance, and develops a Natural Language Processing method for extracting temporal information of events from posts more specifically tweets. Our approach is based on a methodology of temporal markers classes and on a contextual exploration method. To evaluate our model, we built a knowledge management system. Actually, we used a collection of 10 thousand of tweets talking about the current events in 2014 and 2015.


AUTEUR(S)
Soumaya CHERICHI, Rim FAIZ

MOTS-CLÉS
microblogs, infromation pertinente, TALN, recherche de tweets, recherche d’informations.

KEYWORDS
microblogs, relevant information, NLP, tweets search, information retrieval.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (1,32 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier