Création d’un jeu de données pour l’extraction automatique d’information sur des documents en français – mardi 17 novembre 2020 – avec Rachel Keraron

Date / Heure
Date(s) - 17 Nov 2020
19 h 00 - 20 h 30

Catégories

#Document, #Données, #Intelligence artificielle


Création d’un jeu de données pour l’extraction automatique d’information sur des documents en français

Rachel Keraron
Intervenante : Rachel KERARON, Chercheuse en science des données à la société reciTAL.
Les modèles d’apprentissage profond nécessitent des données annotées importantes pour l’entraînement sur une tâche précise. Ces jeux de données annotés peuvent être coûteux à produire.
Face à la prédominance de l’anglais dans les jeux de données déjà disponibles librement pour les modèles d’apprentissage profond, nous discuterons d’un projet qui a permis de créer un jeu de données non-anglophone dans la tâche d’extraction automatique d’information sur des textes francophones.
Nous comparerons cette approche avec d’autres méthodes qui ne nécessitent pas de données d’entraînement natives (modèle multilingue, traduction automatique).
Ce travail a fait l’objet d’une publication dans la Language Ressource and Evaluation Conference. Il a été réalisé dans le cadre du projet PIAF, pour des IAs Francophones.

L’enregistrement vidéo de la conférence sur Zoom :

 


Réservations

Les réservations sont closes pour cet événement.

Print Friendly, PDF & Email
Partager cette page

Laisser un commentaire