Un corpus annoté pour la génération de questions et l’extraction de réponses pour l’enseignement - Information, Langue Ecrite et Signée Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Un corpus annoté pour la génération de questions et l’extraction de réponses pour l’enseignement

Résumé

Dans cette démonstration, nous présenterons les travaux en cours pour l’annotation d’un nouveau corpus de questions-réponses en langue Française. Contrairement aux corpus existant comme “FQuad” ou “Piaf”, nous nous intéressons à l’annotation de questions-réponses “non factuelles”. En effet, si dans la littérature, de nombreux corpus et modèles de questions-réponses pré-entraînés sont disponibles, ceux-ci ne privilégient que rarement les annotations s’appuyant sur un schéma de raisonnement issue de l’agrégation de différentes sources ou contextes. L’objectif du projet associé est de parvenir à la création d’un assistant virtuel pour l’éducation, ainsi des réponses explicatives, de raisonnement et/ou d’agrégation de l’information sont à privilégier. Notons enfin, que la volumétrie des données doit être conséquente, en particulier par la considération d’approches neuronales génératives ou extractives. Actuellement, nous disposons de 262 questions et réponses obtenues durant l’étape de validation de la campagne d’annotation. Une deuxième phase d’annotation avec une volumétrie plus importante débutera fin mai 2022 (environ 8000 questions).
Fichier principal
Vignette du fichier
424.pdf (75.22 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03701465 , version 1 (24-06-2022)

Identifiants

  • HAL Id : hal-03701465 , version 1

Citer

Thomas Gerald, Sofiane Ettayeb, Ha Quang Le, Gabriel Illouz, Patrick Paroubek, et al.. Un corpus annoté pour la génération de questions et l’extraction de réponses pour l’enseignement. Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.14-16. ⟨hal-03701465⟩
144 Consultations
40 Téléchargements

Partager

Gmail Facebook X LinkedIn More