ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Ingénierie des Systèmes d'Information

Networking and Information Systems
1633-1311
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 15/2 - 2010  - pp.49-71  - doi:10.3166/isi.15.2.49-71
TITRE
Approche bayésienne de la composition sémantique dans les systèmes de dialogue oral

TITLE
A bayesian approach to semantic frame composition in a spoken dialog system

RÉSUMÉ
Cet article présente un processus stochastique pour la composition de structures sémantiques, dédié à l'interprétation de dialogues oraux homme-machine. Ce processus permet d'inférer des structures hiérarchiques de cadres sémantiques (CS) à partir des séquences de mots et de concepts de base issues de l'énoncé utilisateur. Un processus logique est d'abord mis en oeuvre pour obtenir une annotation de référence de données d'entraînement. Il est alors possible d'apprendre les paramètres de réseaux bayésiens dynamiques qui sont utilisés pour produire les hypothèses de structures de CS sur les données de test. Des règles logiques viennent finalement compléter les liaisons manquantes entre les CS obtenus lors du décodage séquentiel. Cette approche probabiliste présente l'intérêt de produire des listes scorées d'hypothèses d'arbres sémantiques. Les expériences, menées sur le corpus de dialogues en français MEDIA, montrent que l'approche probabiliste proposée permet de générer une annotation en CS suffisamment fiable et robuste pour être utilisée dans un système de dialogue réel.


ABSTRACT
Focusing on the interpretation component of spoken dialog systems, this paper introduces a stochastic approach based on dynamic Bayesian networks to infer and compose semantic structures from speech. Word strings, basic concept sequences and composed semantic frames (as defined in the Berkeley FrameNet paradigm) are derived sequentially from the users' inputs. A semi-automatic process provides a reference frame annotation of the speech training data. Then the DBN trained on these data are used to hypothesize the frames and their constituents from the test data. Eventually a rule-based process produces the final composed frame annotation. Experimental results on the French MEDIA dialog corpus show the appropriateness of the technique which both lead to good semantic tree identification performance and can provide the dialog manager with n-best lists of scored hypotheses.


AUTEUR(S)
Marie-Jean MEURS, Fabrice LEFÈVRE, Renato DE MORI

MOTS-CLÉS
système de dialogue oral, composition sémantique, réseaux bayésiens dynamiques.

KEYWORDS
spoken dialog system, spoken language understanding, semantic frame composition, dynamic Bayesian networks.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (458 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier