ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
Nouvel éditeur en 2019
 

 ARTICLE VOL 22/2 - 2017  - pp.69-94  - doi:10.3166/isi.22.2.69-94
TITRE
Prédire le codage de diagnostics secondaires. Une expérience basée sur les arbres de décision

TITLE
Predicting the encoding of secondary diagnoses. An experience based on decision trees

RÉSUMÉ
Afin de mesurer l’activité médicale, les hôpitaux sont tenus de coder manuellement des informations concernant les séjours des patients hospitalisés en utilisant la Classification Internationale des Maladies (CIM-10). Cette tâche est chronophage et nécessite une formation importante pour le personnel en particulier pour le codage des diagnostics associés (secondaires). Afin d’assister les personnels hospitaliers dans leur tâche, nous proposons une approche basée sur les techniques de fouille de données et plus précisément les arbres de décision qui permet de prédire le codage des diagnostics associés. Les arbres de décision sont construits à partir des données structurées de la base PMSI (âge, sexe, nombre de diagnostics et actes médicaux ...). Ces arbres de décision sont facilement exploitables par un non spécialiste en informatique tel qu’un médecin. Deux niveaux de granularité de diagnostic ont été exploités selon que l’on choisisse de représenter le diagnostic de façon très précise (fin niveau de granularité) ou en se contentant de garder une information plus générale (niveau de granularité plus grossier) correspondant aux catégories de diagnostics. Trois types d’expérimentations ont été réalisés selon différentes techniques d’équilibrage de dataset. Les résultats obtenus indiquent qu’il existe une variation significative des scores d’évaluation entre les différentes techniques pour les mêmes diagnostics étudiés. Nous mettons en évidence l’efficacité des techniques "random sampling" quels que soient le type de diagnostic et le type de mesure (F1-mesure, le rappel et la précision). Nos résultats montrent également l’efficacité d’utiliser le niveau fin de granularité de diagnostic quel que soit le diagnostic étudié.


ABSTRACT
In order to measure the medical activity, hospitals are required to manually encode diagnoses concerning an inpatient episode using the International Classification of Disease (ICD-10). This task is time consuming and requires substantial training for the staff. In this paper, we are proposing an approach able to speed up and facilitate the tedious manual task of coding patient information, especially while coding some secondary diagnoses that are not well described in the medical resources such as discharge letters and medical records. Our approach leverages data mining techniques, and specifically decision trees, in order to explore medical databases that encode such diagnoses knowledge. It uses the stored structured information (age, gender, diagnoses count, medical procedures, etc.) to build a decision tree which assigns the appropriate secondary diagnosis code into the corresponding inpatient episode. We have evaluated our approach on the PMSI database using fine and coarse levels of diagnoses granularity. Three types of experimentations have been performed using different techniques to balance datasets. The results show a significant variation in the evaluation scores between the different techniques for the same studied diagnoses. We highlight the efficiency of the random sampling techniques regardless of the type of diagnoses and the type of measure (F1-measure, recall and precision).


AUTEUR(S)
Ghazar CHAHBANDARIAN, Nathalie BRICON-SOUF, Imen MEGDICHE, Rémi BASTIDE, Jean-Christophe STEINBACH

MOTS-CLÉS
fouille de données, apprentissage automatique, arbre de décision, PMSI, diagnostiques secondaires, CIM-10.

KEYWORDS
data mining, machine learning, decision tree, PMSI, secondary Diagnoses, coding ICD-10.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (849 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier