Développement d'un modèle de deep learning (Wasserstein GAN) pour l'analyse de données massives des cancers du sein

TitreDéveloppement d'un modèle de deep learning (Wasserstein GAN) pour l'analyse de données massives des cancers du sein
TypeRapport de stage
AuteursCordier Chiara
DirecteursPanloup Fabien, Basseville Agnès
Année2021
URLhttps://dune.univ-angers.fr/fichiers/16002044/2021TMMA14053/fichier/14053F.pdf
Mots-cléscancer, Prédiction, WGAN
Résumé

Durant mon stage au sein de l'Unité Omiques et Data Science de l'Institut de Cancérologie de l'Ouest, j'ai mis en place l'algorithme Wasserstein Generative Adversarial Networks, permettant d'estimer la loi des données d'entraînement et donc de générer des données provenant de cette loi. J'ai travaillé sur des données de transcriptomique représentant le taux d'expression des gènes dans la tumeur pour des patients atteints du cancer du sein ; e but étant de les utiliser pour prédire la réponse au traitement, c'est-à-dire estimer si un patient va rechuter ou non. Le problème de ces données est qu'elles sont déséquilibrées : il y a davantage de guérison que de rechute, ce qui entraîne un mauvais apprentissage des algorithmes de prédiction. J'ai donc utilisé le WGAN pour générer de nouveaux patients virtuels et rééquilibrer les classes.

Résumé en anglais

During my internship in the Omics and Data Science Unit of the West Cancer Institute, I implemented the Wasserstein Generative Adversarial Networks algorithm, making it possible to estimate the law of training data and therefore to generate data from this law. I worked on transcriptomic data representing the level of gene expression in the tumor for breast cancer patients ; the aim is to use them to predict the treatment response, that is to say to estimate whether a patient will relapse or not. The problem with this data is that it is unbalanced : there is more healing than relapse, which leads to poor learning of prediction algorithms. So I used the WGAN to generate new virtual patients and rebalance the classes.

Langue de rédactionFrançais
Nb pages34
Diplôme

Master Mathématiques et Applications

Date de soutenance2021-09-02
EditeurUniversité d'Angers
Place PublishedAngers
Entreprise

Institut de Cancérologie de l'Ouest

Tuteur

Fabien Panloup

Libellé UFR

UFR de Sciences