Développement d’un outil d’aide à la sélection de variant NGS à des fins de sélection génomique
Titre | Développement d’un outil d’aide à la sélection de variant NGS à des fins de sélection génomique |
Type | Rapport de stage |
Auteurs | Kouki Yosra |
Directeurs | Teulat Béatrice |
Année | 2020 |
URL | http://dune.univ-angers.fr/fichiers/17008731/2020TMBV12455/fichier/12455F.pdf |
Mots-clés | filtre, NGS, notation, sélection assistée par marqueurs, SNP |
Résumé | La technologie NGS permet de révolutionner le génotypage et la sélection des plantes. En outre, les marqueurs moléculaires jouent un rôle important dans la génomique des plantes et les études de sélection. Le SNP est le type du marqueur moléculaire utilisé chez HM.Clause pour identifier les QTLs associés aux traits d’intérêt agronomique. Les résultats du séquençage sont énormes et doivent être analysés pour identifier les SNPs de haute qualité. Ainsi, un outil bioinformatique a été développé pour analyser et interpréter les données NGS pour sélectionner automatiquement les meilleurs SNP. Ainsi, nous avons identifié au départ les paramètres appropriés pour filtrer les variantes. Ces paramètres concernent les caractéristiques de la séquence flanquante du SNP (nombre de variantes, contenu en GC ) et les critères génétiques (fréquence des allèles mineurs : MAF, Polymorphism Information Content : PIC, Call rate et effet du SNP). Tous les SNPs ont été notés en fonction du seuil de chaque critère. L’efficacité du filtre et celle de la notation ont été évaluées en utilisant un jeu de données de 2535390 SNPs candidats. La précision du programme qui reflète sa capacité à détecter les bons marqueurs parmi tous les marqueurs testés est de 82%. Cette valeur peut être améliorée en ajustant les seuils des paramètres utilisés pour le filtre des variants. |
Résumé en anglais | NGS technology allows to revolutionize plant genotyping and breeding. In addition, Molecular markers play important roles in plant genomics and breeding studies. Single nucleotide polymorphisms (SNPs) are the molecular markers employed in HM.Clause to identify quantitative trait loci (QTL) for important traits. The results of sequencing are huge and need to be analyzed to identify the SNPs with high quality. Thus, a bioinformatic tool was developed to analyze and interpret GBS data to select automatically the best SNPs. Thus, we identified at the beginning the appropriate parameters for filtering the variants. These parameters concern the characteristics of the SNP flanking sequence (number of variants, GC content, size) and genetic criteria (Minor Allele frequency: MAF, Polymorphism Information Content: PIC value, Call rate and SNP effect). All SNPs were scored according the threshold of each criteria. The filter and the scoring efficiency were evaluated using a data with 2535390 candidates SNPs. The accuracy of the program means its ability to detect the correct markers among all the markers tested is 82%. This value can be improved by adjusting the thresholds of the parameters used for the SNPs filtering. |
Langue de rédaction | Français |
Nb pages | 25 |
Diplôme | Master Biologie Végétale |
Date de soutenance | 2020-09-09 |
Editeur | Université Angers |
Place Published | Angers |
Tuteur | Romain Berruyer |
Libellé UFR | UFR de Sciences |