Soutenance de thèse de Vincent Sater le lundi 27 septembre 2021 à 9h - Amphi 015b - Bât. CURIB UFR Sciences et techniques de Mont Saint Aignan

Date :

...
Vincent Sater soutient sa thèse le lundi 27 septembre 2021 à 9h. La thèse aura lieu dans l'amphithéâtre (015b) du bâtiment CURIB (bâtiment n° 25) à l'UFR Sciences et Techniques au sein du Campus de Mont Saint Aignan. Cette thèse, réalisée à l'Université de Rouen Normandie au sein de l'équipe TIBS du LITIS s'intitule : 

"Développement de nouvelles méthodes algorithmiques pour le traitement des UMI à partir des données de séquençage haut débit"

Vous êtes également conviés au pot qui suivra. Celui-ci se déroulera dans le même bâtiment au rez-de-chaussée, dans les salles 066 et 067.

La soutenance aura lieu devant le jury composé de 
M. Thierry LECROQ, Professeur, Université de Rouen Normandie, Directeur de thèse
M. Philippe RUMINY, Ingénieur/Chargé de recherche, Centre Henri Becquerel, Co-directeur de thèse
Mme Élise PRIEUR-GASTON, Maître de conférences, Université de Rouen Normandie, Co-encadrante de thèse
M. Pierre PETERLONGO, Chargé de recherche, INRIA - Rennes, Rapporteur
Mme Thérèse COMMES, Professeur, Université de Montpellier, Rapporteure
M. Hugues ROEST CROLLIUS, Directeur de recherche, CNRS, Examinateur
Mme Hélène TOUZET, Directrice de recherche, Université de Lille, Examinatrice
M. Jean-Philippe JAIS, Maître de conférences - Université Paris Descartes, Examinateur

Résumé
Les objectifs de cette thèse s’inscrivent dans la large problématique du traitement des données issues de séquenceurs à très haut débit, et plus particulièrement des reads courts, issus de séquenceurs de deuxième génération. Les aspects abordés dans cette problématique se concentrent principalement sur le développement de nouvelles méthodologies se basant sur des séquences moléculaires uniques appelées UMI utilisées pour étiqueter les fragments d'ADN initiaux et permettant d'améliorer la précision des résultats obtenus.

Tout d'abord, dans le domaine de la transcriptomique, une nouvelle méthode a été développée afin d'améliorer les résultats de mesure de l'expression génique d'une part, et de détecter les transcrits de fusion dans les tumeurs d'autre part. Cette méthode se base sur une RT-MLPA couplée à un séquenceur NGS. Elle permet d'amplifier les fragments d'ARN présents dans un échantillon tumoral et d'obtenir les séquences des fragments récoltés. L'analyse sous-jacente vise à analyser ces séquences une par une pour, dans un premier temps, attribuer chaque séquence à l'échantillon séquencé, et dans un deuxième temps, retrouver le nom du gène qu'il exprime. Pour cela, RT-MiS a été développé. RT-MiS est un outil permettant d'effectuer la totalité de l'analyse commençant par l'extraction et la correction des UMI des séquences jusqu'à la production des résultats sous forme de matrice d'expression par gène pour chaque échantillon. RT-MiS comporte aussi une interface d'analyse dédiée permettant de lancer l'outil facilement par les chercheurs. Cette interface permet d'automatiser le plus possible le processus d'analyse complet et de produire les résultats sous formes de figures et graphiques interactifs rendant l'interprétation biologique plus facile.

Ensuite, dans le domaine de la génomique, un nouvel outil de détection de variants somatiques a été développé. L'outil UMI-VarCal est un variant caller basé sur les UMI et donc implémentant une analyse de ces derniers pour appeler efficacement les variants dans les échantillons tumoraux. L'utilité des UMI est mise en évidence par l'amélioration de la précision de détection des variants, surtout quand la fréquence tombe au-dessous de 1%. UMI-VarCal applique un test de Poisson pour filtrer les positions ne présentant pas des variants et puis se sert d'une analyse des UMI et de deux filtres complémentaires pour filtrer les faux positifs. UMI-VarCal a été conçu de façon très optimisée afin d'effectuer son analyse tout en restant plus efficace que les autres outils en termes de détection de variants et de temps d'exécution.

Finalement, et toujours dans le domaine de la détection des variants, un nouveau simulateur de reads a été développé. Cet outil appelé UMI-Gen est le premier simulateur de reads capable de générer des séquences avec des UMI. De plus, UMI-Gen est capable d'insérer des variants somatiques (SNV) ou des variants structuraux (CNV) dans les fichiers simulés. En outre, en analysant un ensemble de fichiers normaux, il est capable d'estimer le bruit de fond dans ces échantillons pour le reproduire dans les reads simulés. Ces fichiers peuvent être utilisés par la suite pour évaluer les variant callers, surtout ceux implémentant une analyse UMI dans leur algorithme.

Mots clés : Séquençage à haut débit, UMI, transcriptomique, expression génique, transcrits de fusion, génomique, variant calling, simulation de reads.


Bien cordialement,

Vincent Sater