ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 22/3 - 2017  - pp.65-88  - doi:10.3166/isi.22.3.65-88
TITRE
Caractéristiques comportementales basées sur le compte pour filtrer les spammeurs sociaux dans les collections de données à grande échelle de Twitter

TITLE
Behavioural account-based features for filtering out social spammers in large-scale twitter data collections

RÉSUMÉ
Les réseaux sociaux en ligne (OSN) sont devenus une source importante d’information pour une vaste gamme d’applications et de recherches. Cependant, la grande facilité d’utilisation et l’accessibilité des OSN ont exposé de nombreux problèmes associés à la qualité de l’information qui, par conséquent, diminuent les performances des applications dépendantes des OSN. Étant donné que Twitter n’est pas à l’abri du problème de spam social, les chercheurs ont conçu diverses méthodes de détection de spam. Cependant, les méthodes de détection basées sur le tweet ne sont pas efficaces pour détecter le contenu spam en raison de la dynamique et l’évolution rapide du contenu spam. En outre, les méthodes basées sur les comptes sont coûteuses pour l’extraction en raison de la nécessité d’un énorme volume de données provenant des serveurs de Twitter, tandis que la plupart des autres fonctionnalités basées sur le compte ne modélisent pas le comportement des spammeurs sociaux. Par conséquent, dans cet article, nous présentons une conception de nouvelles fonctionnalités robustes basées sur le compte pour filtrer les comptes spam existant dans de grandes collections "aspirées".Nos fonctionnalités se concentrent sur la modélisation du comportement des spammeurs sociaux, comme la corrélation du temps entre les tweets. Les résultats expérimentaux montrent que nos nouvelles fonctionnalités comportementales sont capables de classer correctement la majorité des spammeurs sociaux (comptes spam), surperformant 75 fonctionnalités de l’état de l’art.


ABSTRACT
Online social networks (OSNs) have become an important source of information for a tremendous range of applications and researches. However, the high usability and accessibility of OSNs have exposed many information quality (IQ) problems which consequently decrease the performance of OSNs dependent applications. Social spammers are a particular kind of illintentioned users who degrade the quality of OSNs information through misusing all possible services provided by OSNs. Given the fact that Twitter is not immune towards the social spam problem, different researchers have designed various detection methods of a spam content. However, the tweet-based detection methods are not effective for detecting a spam content because of the dynamicity and the fast evolution of spam. Moreover, the robust account-based features are costly for extraction because of the need for huge volume of data from Twitter’s servers, while most other account-based features don’t model the behavior of social spammers. Hence, in this paper, we introduce a design of new 10 robust behavioral account-based features for filtering out spam accounts existing in large-scale Twitter "crawled" data collections. Our features focus on modeling the behavior of social spammers, such as the time correlation among tweets. The experimental results show that our new behavioral features are able to correctly classify the majority of social spammers (spam accounts), outperforming 75 account-based features designed in the literature.


AUTEUR(S)
Mahdi WASHHA, Manel MEZGHANI, Florence SÈDES

MOTS-CLÉS
Twitter, réseau social, spam.

KEYWORDS
Twitter, social network, spam.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (1,2 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier