This protocol describes a rapid and broadly applicable method for unbiased RNA-sequencing of viral samples from human clinical isolates.
Nous présentons ici un ARN protocole de séquençage de nouvelle génération qui permet de novo assemblées et intra-hôte variants appels de génomes viraux recueillies à partir de sources cliniques et biologiques. La méthode est impartiale et universelle; il utilise des amorces aléatoires pour la synthèse d'ADNc et ne nécessite aucune connaissance préalable du contenu de la séquence virale. Avant la construction de la banque, la digestion sélective à base de RNase H est utilisée pour appauvrir l'ARN non désiré – y compris le poly (rA) porteuse et l'ARN ribosomal – à partir de l'échantillon d'ARN viral. déplétion sélective améliore à la fois la qualité des données et le nombre de lit unique, dans des bibliothèques virales de séquençage de l'ARN. En outre, l'étape a 'tagmentation' à base de transposase est utilisée dans le protocole, car il réduit le temps global de la construction de la bibliothèque. Le protocole a permis le séquençage rapide et profonde de plus de 600 échantillons, y compris le virus Lassa et Ebola collections de sang et de tissus isolats et est largement applicable à d'autres études de génomique microbienne.
séquençage de la prochaine génération de virus à partir de sources cliniques peut informer la transmission et l'épidémiologie des infections, ainsi que le soutien de l'aide nouvelle de diagnostic, les vaccins et le développement thérapeutique. synthèse d'ADNc en utilisant des amorces aléatoires a permis la détection et l' assemblage des génomes de divergent, co-infectant ou même de nouveaux virus 1,2. Comme avec d'autres méthodes impartiales, contaminants indésirables occupent beaucoup séquençage lit et un impact négatif sur les résultats de séquençage. Hôte et poly (rA) ARN porteur sont des contaminants présents dans de nombreuses collections virales existantes de l'échantillon.
Le protocole décrit un moyen efficace et rentable de profondes génomes de virus à ARN de séquençage basé sur l'ARN-seq impartiale totale. Le procédé utilise une RNase H déplétion sélective étape 3 pour supprimer ribosomal hôte indésirable et de l' ARN porteur. Déplétion sélective enrichit pour le contenu viral (figure 1) et améliore la qualité globale des données de séquençage(Figure 2) à partir d' échantillons cliniques. En outre, tagmentation est appliqué le protocole, car elle réduit considérablement le temps de construction de bibliothèques. Ces méthodes ont été utilisées pour générer rapidement de grands ensembles de données d'Ebola et Lassa virus génomes 2,4,5 et peuvent être utilisés pour étudier un large éventail de virus à ARN. Enfin, l'approche ne se limite pas à des échantillons humains; l'utilité de l' épuisement sélectif a été démontrée sur des échantillons de tissus prélevés à partir des rongeurs infectés par Lassa et des modèles de maladies de primate non humain 5,6.
Figure 1. L' ARN total du contenu Reflète Enrichissement de Lassa Virus Content Utilisation sélective Épuisement. À partir du contenu global (entrée d'ARN) et l' enrichissement des virus Lassa uniques (LASV) lit (contenu de la bibliothèque) sur ARNr déplétion de neuf isolats cliniques différents. Ce chiffre a été modifié depuis 6 <em>. S'il vous plaît cliquer ici pour voir une version plus grande de cette figure.
Figure 2. Qualité supérieure Séquençage Après l' ARN transporteur Épuisement. Les qualités médians de base par cycle de séquençage de poly (rA) bibliothèques de virus contaminés au Lassa (rouge) et le contrôle (aucun transporteur observé dans la bibliothèque, noir) du QC rapport 13. Les deux lu 1 et lu 2 de fin appariés lectures sont fusionnés dans le fichier de BAM de la bibliothèque et les scores de qualité sont présentés à chaque base. Ce chiffre a été modifié depuis 6. S'il vous plaît cliquez ici pour voir une version plus grande de cette figure.
Le détails du protocole construction de bibliothèques d'ARN-seq virale directement à partir extraitL'ARN collecté à partir d'échantillons cliniques et biologiques. Pour assurer la sécurité personnelle, tous les échantillons viraux sérum, le plasma et les tissus doivent être inactivés dans des tampons appropriés avant l'extraction de l'ARN. Dans certains kits d'inactivation et d'extraction, le transporteur poly (rA) ARN est inclus; ce sera supprimée au cours de la RNase H étape initiale de déplétion sélective. Sur la base de la récupération complète, la concentration attendue de l'ARN porteur est de 100 ng / pl. Dans le protocole, 110 ng / ul oligo dT ARN (concentration de porteurs de 1,1x) est utilisé pour l'épuisement. Si le poly (rA) porteur ne sont pas présents dans l'échantillon, puis l'oligo (dT) ne doit pas être ajouté avant l'épuisement.
Le protocole suivant a été conçu pour 24 réactions dans le format de plaque PCR (jusqu'à un volume de 250 ul). Une version antérieure de ce protocole a été rapporté dans Matranga, et al. 6.
L'approche décrite permet robuste, universel, séquençage rapide et a été utilisé pour le séquençage du virus Ebola au cours de la 2,4 2014 épidémie. Par couplage d'appauvrissement sélectif et la synthèse d'ADNc avec la construction de la bibliothèque de tagmentation, le temps de traitement global a été réduit par ~ 2 jours à partir des procédés de ligature adaptateur précédentes. Plus récemment, ce protocole a été employé par des collaborateurs internationaux et d' autres avec un grand succès 15,16 et sera déployé à des laboratoires en Afrique de l' Ouest pour soutenir les études et diagnostics 17 locales fondées sur la génomique recherche.
Le protocole décrit ici utilise des amorces aléatoires pour préparer l'ADNc pour les bibliothèques d'ARN-seq virales. Contrairement aux approches virales précédentes d'ARN-seq, il ne nécessite pas une connaissance a priori des données de séquence ou la conception d'amorce complexe et prend du temps pour un virus ou clade spécifique. Le procédé peut être appliqué à un échantillon d'ARN viral. Par exemple, il a été utilisé pour générer du contenu viral à la fois Ebolaet des échantillons de Lassa 6. Le protocole peut également être utilisé pour transcriptomique hôte, les projets de séquençage métagénomique et de découverte de l' agent pathogène 1.
Une étape critique du protocole est ciblé RNase H digestion, un haut-débit, méthode peu coûteuse pour éliminer porteuse parasite et de l'ARN hôte à partir d'échantillons viraux. L'étape de déplétion sélective du protocole utilise de nombreux composants et nécessite des compétences et de précision. temps et précautions supplémentaires doivent être prises lors de la configuration initiale.
Comme la plupart des échantillons de sérum et de plasma cliniques ont souvent très peu de matériel d'acide nucléique, la contamination et la perte de l'échantillon sont communs. Pour éviter ces problèmes, une attention particulière doit être prise lors de l'utilisation de ce protocole. Tout d'abord, l'ARN est très sensible à la dégradation; donc tous les domaines doivent être propres et exempts de nucléases. Deuxièmement, pour identifier les échantillons appropriés pour une utilisation dans ce protocole, les essais qRT-PCR pour l'ARN hôte et le virus devraient être utilisés pour la quantification 5,6 </sup>. Lorsque l'on compare l' entrée revient avec des résultats de séquençage du protocole, le succès de séquençage (c. -à- génération de données suffisantes pour l' assemblage viral complet) en corrélation avec les échantillons qui contenaient au moins 100 pg d' ARN total et 1.000 copies du virus. En troisième lieu, l'exposition à des sources d'acides nucléiques de l'environnement doit être évité. Le protocole décrit ici est fait dans une enceinte de sécurité biologique pour les précautions de sécurité et pour limiter les contaminants environnementaux. De plus, notre groupe et d' autres ont remarqué que les enzymes commerciales peuvent être une autre source d'acides nucléiques contaminants bactériens dans des échantillons d'entrée à basse 6,18. Utilisation d'un espace de travail propre (par exemple, hotte PCR, enceinte de sécurité biologique) et des contrôles négatifs (par exemple, l' eau ou du tampon) contribueront à atténuer et de suivre la contamination, respectivement. Pour les échantillons avec <100 pg d'ARN total, seul poly (rA) ARN porteur, non ARNr, devrait être épuisé pour garantir des résultats de séquençage de haute qualité tout en limitant la perte de matériel. Pour les trèsdes échantillons d'entrée faible, les méthodes d'amplification d' ADNc peut être plus approprié 19, bien que le poly (rA) support doit être éliminé avant la synthèse de l' ADNc.
L'épuisement de l' hôte ARNr pour enrichir le contenu viral dans les bibliothèques de séquençage et est applicable à la collecte d'échantillons différents , y compris le sérum ou le plasma, et de multiples types de tissus prélevés sur des rongeurs et des primates non humains 5,6. Dans les organismes non humains, les lectures alignant sur 28S est resté après l' épuisement, ce qui suggère 28S est moins conservée entre les humains et les autres espèces de 6,20. Lors de l' utilisation de cette méthode avec les isolats non humains, il peut être nécessaire de compléter avec des oligos d'ADN complémentaires aux séquences d' ARNr divergentes de la 3,21 hôte spécifique.
Étant donné que le protocole est impartiale, virale lit peut représenter seulement une petite fraction du contenu de la bibliothèque totale. Bien que l'ARNr est l'espèce la plus abondante de l'ARN hôte et seul un faible pourcentage des ARNr lit (0; 1%) se trouvent après l' épuisement sélectif, tous les autres ARN hôte (par exemple, ARNm) restera après l' épuisement et peut expliquer beaucoup de séquençage lit à partir de l'échantillon. Par conséquent , «suréchantillonnage» (c. -à- oversequencing) bibliothèques individuelles est nécessaire afin d'avoir une couverture suffisante pour montage et variantes appels viraux. Pour nos études, nous essayons de séquence ~ 20 millions lit par échantillon pour avoir assez de profondeur pour l' analyse des variantes génomiques et associée virale ainsi que le contenu métagénomique 2,5. Pour les études de découverte metagénomiques et d'agents pathogènes, il est important de noter que la contamination de l'ADN de l'hôte est éliminée par digestion par la DNase. Par conséquent, les virus et autres agents pathogènes qui contiennent des génomes d'ADN peuvent être perdues au cours du procédé, cependant intermédiaires d'ARN peuvent encore être séquencées.
The authors have nothing to disclose.
This work has been funded in part with Federal funds from the National Institutes of Health, Office of Director, Innovator (No.: DP2OD06514) (PCS) and from the National Institute of Allergy and Infectious Diseases, National Institutes of Health, Department of Health and Human Services, under Contracts (No:HHSN272200900018C, HHSN272200900049C and U19AI110818).
96-Well PCR Plates | VWR | 47743-953 | |
Strips of Eight Caps | VWR | 47745-512 | |
Nuclease-free water | Ambion | AM9937 | 50 ml bottle |
TURBO DNase | Ambion | AM2238 | post RNA extraction step, 2 U/µL, buffer included |
PCR cycler | any PCR cyclers | ||
Agencourt RNAClean XP SPRI beads | Beckman Coulter Genomics | A63987 | beads for RNA cleanup |
Real Time qPCR system | any system | ||
DynaMag-96 Side Skirted Magnet | Invitrogen | 12027 | |
70% Ethanol | prepare fresh | ||
qRT-PCR primers | IDT DNA | see Table 2 | |
5M NaCl | Ambion | AM9760G | |
1M Tris-HCl pH 7.4 | Sigma | T2663-1L | |
1M Tris-HCl pH 7.5 | Invitrogen | 15567-027 | |
1M MgCl2 | Ambion | AM9530G | |
Linear acrylamide | Ambion | AM9520 | |
DNA oligos covering entire rRNA region | IDT DNA | see Table 3, order lab-ready at 100 µM | |
Oligo (dT) | IDT DNA | 40 nt long, desalted | |
Hybridase Thermostable RNase H | Epicentre | H39100 | |
RNase-free DNase Kit | Qiagen | 79254 | post selective depletion step |
SUPERase-In RNase Inhibitor | Ambion | AM2694 | |
Random Primers | Invitrogen | 48190-011 | mostly hexamers |
10 mM dNTP mix | New England Biolabs | N0447L | |
SuperScript III Reverse Transcriptase | Invitrogen | 18080-093 | with first-strand buffer, DTT |
Air Incubator | any air incubator cyclers | ||
NEBNext Second Strand Synthesis (dNTP-free) Reaction Buffer | New England Biolabs | B6117S | 10x |
E. coli DNA Ligase | New England Biolabs | M0205L | 10 U/μl |
E. coli DNA Polymerase I | New England Biolabs | M0209L | 10 U/μl |
E. coli RNase H | New England Biolabs | M0297L | 2 U/μl |
0.5M EDTA | Ambion | AM9261 | |
Agencourt AMPure XP SPRI beads | Beckman Coulter Genomics | A63881 | beads for DNA cleanup |
Elution Buffer | Qiagen | 10 mM Tris HCl, pH 8.5 | |
Quant-iT dsDNA HS Assay Kit | Invitrogen | Q32854 | |
Qubit fluorometer | Invitrogen | Q32857 | |
Nextera XT DNA Sample Prep Kit | Illumina | FC-131-1096 | |
Nextera XT DNA Index Kit | Illumina | FC-131-1001 | |
Tapestation 2200 | Agilent | G2965AA | |
High Sensitivity D1000 reagents | Agilent | 5067-5585 | |
High Sensitivity D1000 ScreenTape | Agilent | 5067-5584 | |
BioAnalyzer 2100 | Agilent | G2939AA | |
High Sensitivity DNA reagents | Agilent | 5067-4626 | |
Library Quantification Complete kit (Universal) | Kapa Biosystems | KK4824 | alternative to tapestation, bioanalyzer for library quantification |