PacBio annonce une nouvelle méthode d'analyse informatique pour les gènes hautement homologues
LaboratoryPacBio, l'un des principaux développeurs de solutions de séquençage hautement précises, a annoncé une nouvelle méthode informatique qui génotype les paralogues et les pseudogènes de gènes avec une grande précision. Le nouvel outil informatique, nommé « Paraphase », permet l'appel de variantes, l'analyse du nombre de copies et la mise en phase en identifiant la séquence complète du gène de chacun des haplotypes pour tous les gènes et pseudogènes de la même famille de gènes. De nombreux gènes médicalement pertinents tombent dans des duplications segmentaires et ont donc des membres de la famille de gènes ou des pseudogènes très similaires. La similarité de séquence conduit souvent à un alignement de lecture sujet aux erreurs et à l'appel de variantes. "Grâce à l'utilisation de Paraphase, nous sommes en mesure d'identifier la séquence complète de chaque copie d'un gène et, surtout, d'identifier le nombre de copies fonctionnelles et non fonctionnelles d'un gène", a déclaré Mike Eberle, vice-président de la biologie computationnelle chez PacBio . « Cela permettra aux chercheurs d'effectuer des analyses de porteurs plus précises et de fournir un cadre pour l'étude de la génétique sous-jacente de ces régions génomiques complexes. Nous pensons que l'application de cette méthode à des données de population plus vastes et diversifiées permettra aux chercheurs de mieux comprendre les problèmes médicalement importants, tels que les porteurs silencieux de l'amyotrophie spinale. La paraphase a été utilisée sur plusieurs gènes médicalement pertinents avec des paralogues ou pseudogènes très similaires, notamment , CYP21A2 (hyperplasie congénitale des surrénales déficiente en 21-hydroxylase), TNXB (syndrome d'Ehlers-Danlos), STRC (surdité et surdité héréditaires) et SMN1 et 2 (amyotrophie spinale). SMN1 est> 99,9% similaire en séquence à son paralogue, SMN2, et les deux gènes ont des nombres de copies variables d'une population à l'autre. Les mutations de SMN1 provoquent une amyotrophie spinale (SMA), une des principales causes de décès précoces chez les nourrissons. L'analyse détaillée de la séquence à haut débit de gènes complets est difficile à utiliser avec les technologies existantes et l'identification des porteurs silencieux (ayant deux copies de SMN1 sur un chromosome et zéro copie sur l'autre, représentant 27 % des porteurs dans les populations africaines) est impossible sans informations généalogiques. Dans une récente publication évaluée par des pairs, Paraphase a détecté ces variants pathogènes pour la SMA. L'étude a également identifié les principaux haplogroupes de séquences SMN1 et SMN2 et caractérisé leur co-ségrégation grâce à des analyses basées sur l'arbre généalogique. De plus, les auteurs ont identifié une paire d'haplotypes pouvant servir de marqueur génétique pour les allèles porteurs de deux copies de SMN1 dans les populations africaines, démontrant le potentiel du dépistage basé sur l'haplotype des porteurs silencieux. âLe fait que le séquençage HiFi permet non seulement d'accéder aux régions les plus difficiles du génome humain, mais permet également d'appeler tous les types de variants connus, tels que les SNV, les Indels et les SV, y compris les CNV, ainsi que la mise en phase de ces loci, est très prometteur. pour des applications dans la recherche sur les maladies rares », a déclaré Alexander Hoischen, Ph.D., professeur agrégé de technologies génomiques et d'immuno-génomique au Radboud University Medical Center. La paraphase est étendue à un appelant paralogue généralisé à l'échelle du génome, car des gènes plus hautement homologues sont inclus. Paraphase travaille sur le séquençage du génome entier et les données d'enrichissement basées sur la capture hybride. Il peut également être adapté pour fonctionner avec des données de séquençage d'amplicons lorsque toutes les régions d'intérêt sont capturées ou amplifiées.
“PacBio annonce une nouvelle méthode informatique qui génotype les paralogues et les pseudogènes de gènes avec une grande précision“
