Offre d'emploi

Post-doc Deep learning pour la valorisation de journaux anciens

Présentation

Déployer la puissance des réseaux de neurones convolutionnels profonds afin de plonger les documents anciens dans l’ère numérique.

Le LITIS a conçu et développé une suite logicielle appelée PIVAJ destinée aux archives et bibliothèques qui souhaitent valoriser leurs archives de journaux anciens : comment extraire sections et articles automatiquement de numérisation de journaux ? PIVAJ est actuellement utilisé par plusieurs bibliothèques nationales, notamment celles du Pays de Galles et de Finlande.

Le projet ASTURIAS vise à développer les futures technologies utilisées dans PIVAJ, en s’appuyant sur les meilleures techniques d’analyse d’images de documents, et en ajoutant de nouvelles fonctionnalités comme l’extraction d’entités nommées ou la thématisation d’articles.

Figure 1: Classification au niveau pixel de différentes parties d'une page de journal

Mission

Dans le cadre de ce projet, nous proposons un poste de post-doc/ingénieur de recherche de 24 mois en apprentissage pour l’analyse d’images de journaux. La personne recrutée sera en charge de deux missions :

Extraction de structure

Pour cela nous souhaitons utiliser les méthodes à l'état de l'art en analyse d’images basées sur les réseaux de neurones profond (deep learning), et notamment ici les évolutions récentes des réseaux de neurones convolutifs (FCN, gated/self-attention) et récurrents (mécanismes d’attention).

Il s’agira :

·       D’analyser chaque page pour retrouver les blocs de texte, les titres, les images, les pubs…

·       De retrouver un ou des sens de lecture 

·       D’utiliser les blocs trouvés et le sens de lecture pour retrouver sections et articles dans une page…

·       … et à l’échelle du numéro.

PIVAJ

La personne recrutée devra faire évoluer PIVAJ pour prendre en compte les innovations développées dans le cadre de l’extraction de structures, mais également d’entités nommées et de thématisation développées par nos partenaires dans le projet ASTURIAS.

Organisation