Soutenance de Mélodie Boillet le Mardi 10 janvier à 14h, Amphi Sophie Germain UFR Sciences

Date :

...

Mélodie Boillet soutiendra sa thèse le mardi 10 janvier à 14h00 dans l'amphithéâtre Sophie Germain (D)de l'UFR Sciences et Techniques, au campus du Madrillet (Saint-Étienne-du-Rouvray).

Cette thèse a été réalisée dans le cadre d'une collaboration CIFRE entre TEKLIA et l'équipe Apprentissage du LITIS (Université de Rouen-Normandie) et est intitulée :

"Détectiοn d'Objets dans les Dοcuments Numérisés par Réseaux de Neurοnes Prοfοnds".

La soutenance aura lieu devant un jury composé de :

  • Andreas Fischer, Professeur à l'Institute of Artificial Intelligence and Complex Systems à Fribourg (Suisse), Rapporteur
  • Harold Mouchère, Professeur à l'Université de Nantes, Rapporteur
  • Laurence Likforman, Maître de conférences (HDR) à Télécom ParisTech, Examinatrice
  • Caroline Petitjean, Professeure à l'Université de Rouen Normandie, Examinatrice
  • Thierry Paquet, Professeur à l'Université de Rouen Normandie, Directeur de thèse
  • Christopher Kermorvant, Président de Teklia, Co-encadrant de thèse

La soutenance publique se déroulera sous un format hybride. Les personnes qui souhaitent assister à la soutenance à distance sont invitées via le lien Zoom suivant :

Participer à la réunion Zoom
https://cnrs.zoom.us/j/94350259642?pwd=bHlkbHZESzVybWxVU3hBT3VaQWp0Zz09

ID de réunion : 943 5025 9642
Code secret : R7YW94

Résumé

Les documents constituent un ensemble précieux d'informations souvent difficilement accessible dans leur forme originale. La transformation de ces documents en documents digitaux est désormais possible grâce à l'extraction automatique de leurs contenus. Celle-ci nécessite la détection de différents éléments tels que les lignes de texte, éléments cruciaux afin d'obtenir la transcription du texte présent dans les images.

Dans cette thèse, nous étudions différentes tâches liées à l'analyse de la mise en page de documents telles que la détection de lignes de texte, du support d'écriture, ou encore la séparation en actes. Notre objectif est de proposer des modèles permettant de détecter les objets en tenant compte des difficultés liées au traitement de documents et aux contraintes liées à leur utilisation dans un cadre industriel. Nous proposerons une étude complète de la tâche de détection d'objets dans les images de documents en analysant les annotations, différentes stratégies de sélection des données ainsi que les protocoles d'évaluation.