Développement d'un modèle de deep learning (Wasserstein GAN) pour l'analyse de données massives des cancers du sein
Titre | Développement d'un modèle de deep learning (Wasserstein GAN) pour l'analyse de données massives des cancers du sein |
Type | Rapport de stage |
Auteurs | Cordier Chiara |
Directeurs | Panloup Fabien, Basseville Agnès |
Année | 2021 |
URL | https://dune.univ-angers.fr/fichiers/16002044/2021TMMA14053/fichier/14053F.pdf |
Mots-clés | cancer, Prédiction, WGAN |
Résumé | Durant mon stage au sein de l'Unité Omiques et Data Science de l'Institut de Cancérologie de l'Ouest, j'ai mis en place l'algorithme Wasserstein Generative Adversarial Networks, permettant d'estimer la loi des données d'entraînement et donc de générer des données provenant de cette loi. J'ai travaillé sur des données de transcriptomique représentant le taux d'expression des gènes dans la tumeur pour des patients atteints du cancer du sein ; e but étant de les utiliser pour prédire la réponse au traitement, c'est-à-dire estimer si un patient va rechuter ou non. Le problème de ces données est qu'elles sont déséquilibrées : il y a davantage de guérison que de rechute, ce qui entraîne un mauvais apprentissage des algorithmes de prédiction. J'ai donc utilisé le WGAN pour générer de nouveaux patients virtuels et rééquilibrer les classes. |
Résumé en anglais | During my internship in the Omics and Data Science Unit of the West Cancer Institute, I implemented the Wasserstein Generative Adversarial Networks algorithm, making it possible to estimate the law of training data and therefore to generate data from this law. I worked on transcriptomic data representing the level of gene expression in the tumor for breast cancer patients ; the aim is to use them to predict the treatment response, that is to say to estimate whether a patient will relapse or not. The problem with this data is that it is unbalanced : there is more healing than relapse, which leads to poor learning of prediction algorithms. So I used the WGAN to generate new virtual patients and rebalance the classes. |
Langue de rédaction | Français |
Nb pages | 34 |
Diplôme | Master Mathématiques et Applications |
Date de soutenance | 2021-09-02 |
Editeur | Université d'Angers |
Place Published | Angers |
Entreprise | Institut de Cancérologie de l'Ouest |
Tuteur | Fabien Panloup |
Libellé UFR | UFR de Sciences |