Date / Heure
Date(s) - 17 Nov 2020
19 h 00 - 20 h 30
Catégories
#Document, #Données, #Intelligence artificielleCréation d’un jeu de données pour l’extraction automatique d’information sur des documents en français

Intervenante : Rachel KERARON, Chercheuse en science des données à la société reciTAL.
Les modèles d’apprentissage profond nécessitent des données annotées importantes pour l’entraînement sur une tâche précise. Ces jeux de données annotés peuvent être coûteux à produire.
Face à la prédominance de l’anglais dans les jeux de données déjà disponibles librement pour les modèles d’apprentissage profond, nous discuterons d’un projet qui a permis de créer un jeu de données non-anglophone dans la tâche d’extraction automatique d’information sur des textes francophones.
Nous comparerons cette approche avec d’autres méthodes qui ne nécessitent pas de données d’entraînement natives (modèle multilingue, traduction automatique).
Ce travail a fait l’objet d’une publication dans la Language Ressource and Evaluation Conference. Il a été réalisé dans le cadre du projet PIAF, pour des IAs Francophones.
L’enregistrement vidéo de la conférence sur Zoom :
Réservations
Les réservations sont closes pour cet événement.