Grand

Nouvelles

MaisonMaison / Nouvelles / Grand

Aug 03, 2023

Grand

Parasites & Vectors volume 16, Numéro d'article : 265 (2023) Citer cet article 90 Accès 4 Détails Altmetric Metrics Les flavivirus sont un groupe diversifié de virus à ARN, qui incluent les virus étiologiques.

Parasites & Vecteurs volume 16, Numéro d'article : 265 (2023) Citer cet article

90 accès

4 Altmétrique

Détails des métriques

Les flavivirus constituent un groupe diversifié de virus à ARN, qui comprennent les agents étiologiques du Zika, de la dengue et de la fièvre jaune transmis par les moustiques. Les flavivirus ne codent pas pour la transcriptase inverse et ne peuvent pas effectuer de transcription inverse en ADN, mais les séquences d'ADN des flavivirus se trouvent à la fois intégrées dans les chromosomes des moustiques Aedes aegypti et sous forme de séquences extrachromosomiques. Nous avons déjà examiné l'Ae. aegypti pour identifier les intégrations de flavivirus et analysé la conservation de ces séquences parmi les données du génome entier de 464 Ae. aegypti collectés dans 10 pays à travers le monde. Ici, nous avons étendu cette analyse en identifiant les séquences de flavivirus dans ces échantillons indépendamment de l’Ae. aegypti assemblage de référence. Notre objectif était d’identifier l’ensemble des séquences virales, y compris celles absentes du génome de référence, ainsi que leur répartition géographique. Nous avons comparé les séquences identifiées à l'aide de BLASTn et appliqué des méthodes d'apprentissage automatique pour identifier des groupes de séquences similaires. Outre les groupes de séquences correspondant aux quatre événements d’intégration virale que nous avions décrits précédemment, nous avons identifié 19 groupes plus petits. Le seul groupe présentant une forte association géographique était constitué de séquences de type virus d'agent de fusion cellulaire spécifiques à la Thaïlande. Les groupes restants n’avaient pas d’association géographique et étaient pour la plupart constitués de courtes séquences presque identiques sans forte similitude avec les génomes flaviviraux connus. Les données de séquençage en lecture courte ne nous ont pas permis de déterminer si les séquences identifiées étaient extrachromosomiques ou intégrées à Ae. aegypti. Nos résultats suggèrent que la souche Liverpool et le champ Ae. Les moustiques aegypti possèdent une variété similaire d’ADN flaviviral conservé, dont le rôle fonctionnel devrait être étudié dans des études de suivi.

Dans notre précédente publication [1], nous avons examiné les génomes de référence d'Aedes aegypti et d'Ae. albopictus pour identifier les séquences intégrées de flavivirus afin d'améliorer notre compréhension des éléments viraux endogènes non rétroviraux (nrEVE) (voir [2] pour une revue récente). Nous avons également examiné les données de séquençage du génome entier d'Aedes accessibles au public pour comprendre la conservation des séquences virales identifiées. Nous avons constaté que les nrEVE dans Ae. albopictus étaient très diversifiés et peu conservés. En revanche, nous avons constaté que presque tous les nrEVE de l’Ae. Le génome de référence d'aegypti est issu de quatre événements d'intégration virale (VIE) distincts. Nous avons conclu que la diversité des séquences flavivirales nrEVE dans le génome de référence est le résultat de la duplication et de la fragmentation de ces quatre VIE. L'Ae. Les fragments nrEVE d'aegypti étaient présents dans presque tous les isolats séquencés examinés, mais présentaient une structure phylogénétique en forme d'étoile sans clades, ce qui indique un événement récent d'expansion de la population à partir d'un ancêtre commun.

Parallèlement à ces quatre événements principaux, dans nos travaux précédents, nous avons observé de nombreuses séquences courtes (<50 nt) de type flavivirus dans l'Ae. aegypti, que nous n’avions pas analysé à l’époque [1]. De plus, d'autres investigations ont trouvé de longues séquences avec une très forte identité (> 95 %) avec un virus agent de fusion cellulaire (NC_001564.2), avec une certaine spécificité géographique [3, 4]. D'autres études ont montré que l'ADN viral est généré par les moustiques Aedes lors d'une infection à flavivirus [5, 6].

La limite de notre approche précédente était l’accent mis sur les nrEVE présents dans les génomes de référence des moustiques. Dans ce bref rapport, nous abordons cette limitation en examinant le paysage de l’ADN flaviviral putatif (pfDNA) chez Ae. aegypti indépendamment du génome de référence. Plus précisément, nous visions à identifier tout ADNpf géographiquement spécifique qui est absent dans le génome de référence. Dans une analyse robuste, nous avons également délibérément inclus des séquences de haute qualité avec une longueur de correspondance très courte entre l'ADN du moustique et les séquences virales afin de renforcer tous les signaux de séquence conservés dans les régions géographiques. Comme nous utilisons des données de séquençage à lecture courte, nous ne sommes pas en mesure de déterminer si les séquences d'ADNpf sont intra- ou extrachromosomiques. Nous ne réexaminons pas non plus les séquences appartenant aux quatre événements d'intégration virale (VIE1 à VIE4), comme décrit précédemment [1]. Pour notre analyse, nous avons aligné 464 Ae accessibles au public. aegypti des bibliothèques de séquençage du génome entier (WGS) [7] à toutes les séquences de Flaviviridae de la base de données NCBI RefSeq (n = 118, en avril 2020) [7] et aux nrEVE que nous avons identifiés précédemment [1] (Tableau 1, fichier supplémentaire 2 : Fig. S1). Pour l'alignement, nous avons utilisé le logiciel bowtie2 [8] avec des réglages très sensibles (-D 15 -R 2 -N 0 -L 11 -i S, 1, 0.75). Les lectures cartographiées ont été assemblées de novo à l'aide du logiciel SPAdes (v3.13.0) [9] en 25 049 contigs, avec un nombre médian de 53 contigs par isolat (plage : 8 à 138). La distribution des longueurs de contig suivait une distribution de type exponentiel avec une longueur médiane de 200 nt et un contig le plus long de 10 057 nt.

 97%) compared to Calbertado virus [1]. Thus, cluster 3 corresponds to what we previously termed VIE1. Based on our analysis here, the Ae. aegypti AaegL5 reference assembly has only half of the VIE1 sequence. This result is consistent with our previous observation that VIE1 is less conserved than VIE2, VIE3 or VIE4 [1]./p> 95% identity. The cluster was most prevalent in Ghana (19%) and Senegal (13%)./p> 100 nt (Additional file 3: Table S1). This bifurcation of clusters into those that contain only sequences < 50 nt and those that include sequences > 100 nt serves to separate white noise from genuine hits./p> 95% identity to sequences of these VIEs. Consequently, these 46 contigs also had hits against the Ae. aegypti reference genome. In addition, all four Madagascan samples had an identical 606-nt sequence that matched a 743–1349-nt region of a Cell-fusing agent virus with 86% identity. The remaining 516 contigs in the cluster had short (25–72 nt) hits against the viral genome and similar length hits (28–72 nt) against the Ae. aegypti reference genome. In post-clustering quality control, we found that clustering of these sequences was a statistical artifact. The e-value for pairs of contigs without any BLASTn hit was set to 1.0, and as a result the main similarity between these 516 contigs was dissimilarity to other contigs./p>