Skip to main content

Développement d'un modèle de deep learning (Wasserstein GAN) pour l'analyse de données massives des cancers du sein

Mots clés
Résumé en français

Durant mon stage au sein de l'Unité Omiques et Data Science de l'Institut de Cancérologie de l'Ouest, j'ai mis en place l'algorithme Wasserstein Generative Adversarial Networks, permettant d'estimer la loi des données d'entraînement et donc de générer des données provenant de cette loi. J'ai travaillé sur des données de transcriptomique représentant le taux d'expression des gènes dans la tumeur pour des patients atteints du cancer du sein ; e but étant de les utiliser pour prédire la réponse au traitement, c'est-à-dire estimer si un patient va rechuter ou non. Le problème de ces données est qu'elles sont déséquilibrées : il y a davantage de guérison que de rechute, ce qui entraîne un mauvais apprentissage des algorithmes de prédiction. J'ai donc utilisé le WGAN pour générer de nouveaux patients virtuels et rééquilibrer les classes.

Résumé en anglais

During my internship in the Omics and Data Science Unit of the West Cancer Institute, I implemented the Wasserstein Generative Adversarial Networks algorithm, making it possible to estimate the law of training data and therefore to generate data from this law. I worked on transcriptomic data representing the level of gene expression in the tumor for breast cancer patients ; the aim is to use them to predict the treatment response, that is to say to estimate whether a patient will relapse or not. The problem with this data is that it is unbalanced : there is more healing than relapse, which leads to poor learning of prediction algorithms. So I used the WGAN to generate new virtual patients and rebalance the classes.

Année
2021
Année de soutenance
2021-09-02
Nombre de pages
34
Type de dépôt
Rapport de stage
Langue de publication
Français
Éditeur
Université d'Angers
Lieu d'édition
Angers
Citation Key
dune14053
URL
https://dune.univ-angers.fr/fichiers/16002044/2021TMMA14053/fichier/14053F.pdf
Libellé de l'étape
M2 Maths Appli / Data sciences & Données Bio & Numériques
Bac+
5
Maître de stage
Agnès Basseville
Publication du contenu
Libellé de l'UFR
UFR de Sciences
Libellé du diplôme
Master Mathématiques et Applications
Entreprise
Institut de Cancérologie de l'Ouest
Tuteur
Fabien Panloup
Fichier