ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Décisions, argumentation et traçabilité dans l’Ingénierie des Systèmes d’Information
En savoir plus >>
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 9/1 - 2004  - pp.61-83  - doi:10.3166/isi.9.1.61-83
TITRE
Diviser pour découvrir. Une méthode d'analyse du comportement de tous les utilisateurs d'un site web

RÉSUMÉ
Les travaux présentés dans cet article ont pour but d'augmenter de manière significative la pertinence et l'intérêt des motifs découverts par un processus de Web Usage Mining. En effet les motifs séquentiels découverts sur des fichiers logs, sauf s'ils sont découverts sous contraintes, sont trop souvent dénués d'intérêt en raison de leur caractère évident. Notre objectif est de découvrir des comportements parfois minoritaires mais dont la cohérence les rend trop intéressants pour ne pas les considérer (comme les attaques pirates sur un site ou les personnes qui consultent la présentation du projet de recherche « alpha »). En nous basant sur une classification des motifs séquentiels obtenus sur le log, nous proposons une division récursive du problème. Cette classification repose sur des résumés des motifs et sur l'exploitation de réseaux de neurones. Nos expérimentations montrent l'obtention des motifs visés, mais aussi que leur découverte par un processus classique est impossible car elle demande de spécifier un support trop faible (jusqu'à 0,006 %). En effet l'intégralité des sessions présente une telle diversité de comportements que les plus minoritaires (sortes de « niches ») sont à la fois nombreux et particulièrement difficiles à isoler.


ABSTRACT
The goal of this work will be to increase the relevance and the interest of patterns discovered by a Web Usage Mining process. Indeed, the sequential patterns discovered on web log files, unless they are discovered under constraints, often lack interest because of their obvious content. Our goal is to discover minority users behaviors having a coherence which we want to be aware of (like hacking activities on the Web site or a users activity limited to a specific part of the Web site). Our experiments show that we obtain the targeted patterns and that their discovery by means of a classical process is impossible because of a very weak support (up to 0.006 %).


AUTEUR(S)
Florent MASSEGLIA, Doru TANASA, Brigitte TROUSSE

MOTS-CLÉS
web usage mining, motifs séquentiels, classification, résumé des motifs.

KEYWORDS
web usage mining, sequential patterns, clustering, patterns summary, neural networks.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (419 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier