This protocol describes a rapid and broadly applicable method for unbiased RNA-sequencing of viral samples from human clinical isolates.
Qui descriviamo un protocollo sequenza di RNA di nuova generazione che permette de novo assemblee e chiamate variante intra-host dei genomi virali raccolti da fonti clinici e biologici. Il metodo è imparziale e universale; utilizza primer casuali per la sintesi del DNA e non richiede alcuna conoscenza preliminare del contenuto di sequenza virale. Prima costruzione della libreria, selettivo digestione RNasi H-based è utilizzata per esaurire indesiderato RNA – vettore compreso poli (Ra) e RNA ribosomiale – dal campione di RNA virale. deplezione selettiva migliora sia la qualità dei dati e il numero di univoco legge in biblioteche RNA virali sequenziamento. Inoltre, passo un trasposasi-based 'tagmentation' è usato nel protocollo in quanto riduce il tempo complessivo di costruzione biblioteca. Il protocollo ha permesso un rapido sequenziamento profondo di oltre 600 campioni, tra cui Lassa e Ebola virus collezioni sia da sangue e tessuti isolati, ed è ampiamente applicabile ad altri studi di genomica microbica.
La nuova generazione di sequenziamento del virus da fonti cliniche può informare la trasmissione e l'epidemiologia delle infezioni, così come l'aiuto supporto romanzo diagnostica, vaccini e lo sviluppo terapeutico. sintesi del DNA utilizzando primer casuali ha permesso l'individuazione e l'assemblaggio dei genomi da divergenti, co-infettante o anche di nuovi virus 1,2. Come con altri metodi imparziali, contaminanti indesiderati occupano molti sequenziamento legge e un impatto negativo i risultati di sequenziamento. Host e poli (Ra) RNA carrier sono contaminanti presenti in molte collezioni di campioni virali esistenti.
Il protocollo descrive un modo efficiente ed economico di profondi genomi virali sequenza di RNA sulla base imparziale totale RNA-Seq. Il metodo utilizza una deplezione selettiva passo RNase H 3 per rimuovere indesiderati ribosomiale host e l'RNA carrier. Deplezione selettiva arricchisce di contenuti virali (Figura 1) e migliora la qualità complessiva dei dati di sequenziamento(Figura 2) da campioni clinici. Inoltre, tagmentation viene applicato al protocollo poiché riduce notevolmente i tempi di costruzione libreria. Questi metodi sono stati utilizzati per generare rapidamente grandi quantità di dati di Ebola e Lassa genomi virali 2,4,5 e possono essere utilizzati per studiare una vasta gamma di virus a RNA. Infine, il metodo non è limitato a campioni umani; l'utilità di esaurimento selettivo è stata dimostrata su campioni di tessuto raccolti da roditori Lassa-infette e modelli di malattia di primati non umani 5,6.
Figura 1. L'RNA totale contenuto riflette Arricchimento di Lassa Virus Content Utilizzando selettiva esaurimento. Partendo contenuto complessivo (ingresso RNA) e l'arricchimento di unico virus Lassa (LASV) legge (contenuto Library) sulla riduzione di rRNA da nove diversi isolati clinici. Questa cifra è stata modificata da 6 <em>. Fai clic qui per vedere una versione più grande di questa figura.
Figura 2. più di alta qualità Sequencing Dopo Carrier RNA esaurimento. Qualità di base mediani per ciclo di sequenziamento di poli (rA) -contaminated librerie virus Lassa (rosso) e di controllo (nessun vettore osservata in biblioteca, nero) dal rapporto QC 13. Sia in lettura 1 e 2 lettura di fine accoppiato letture vengono uniti nel file BAM biblioteca e il punteggio di qualità sono mostrati in ogni base. Questa cifra è stata modificata dal 6. Clicca qui per vedere una versione più grande di questa figura.
I dettagli del protocollo di costruzione virale RNA-Seq di librerie direttamente da estrattiRNA raccolti da campioni clinici e biologici. Per garantire la sicurezza personale, tutti i campioni di siero, plasma e del tessuto virali, devono essere inattivati nei buffer appropriato prima estrazione di RNA. In alcuni kit di inattivazione e di estrazione, vettore poli (rA) RNA è incluso; questo verrà rimosso durante la fase di svuotamento selettivo iniziale RNase H. Sulla base di recupero completo, la concentrazione atteso di RNA carrier è di 100 ng / ml. Nel protocollo, 110 ng / ml oligo dT RNA (concentrazione di portatori 1.1x) viene utilizzato per esaurimento. Se poly (rA) vettore non è presente nel campione, quindi oligo (dT) non dovrebbe essere aggiunto prima della deplezione.
Il seguente protocollo è stato progettato per 24 reazioni in formato piastra PCR (fino a 250 volumi mL). Una precedente versione di questo protocollo è stato segnalato in Matranga, et al. 6.
L'approccio delineato consente robusto, universale, rapida sequenza ed è stato utilizzato per il sequenziamento virus Ebola nel corso del 2014 2,4 scoppio. Accoppiando deplezione selettiva e sintesi del DNA con la costruzione biblioteca tagmentation, il tempo complessivo processo è stato ridotto di ~ 2 giorni da precedenti metodi adattatore legatura. Più di recente, questo protocollo è stato impiegato da collaboratori internazionali e gli altri con grande successo 15,16 e verrà distribuito ai laboratori in Africa occidentale per sostenere gli studi di ricerca genomica basata su locali e diagnostica 17.
Il protocollo qui descritto utilizza primer casuali per preparare cDNA per le librerie di RNA-Seq virali. A differenza dei precedenti approcci RNA-seq virali, essa non richiede una conoscenza a priori dei dati di sequenza o di progettazione Primer elaborato e richiede tempo per un virus o clade specifico. Il metodo può essere applicato a qualsiasi campione di RNA virale. Ad esempio, è stato utilizzato per generare contenuti virali sia Ebolae campioni Lassa 6. Il protocollo può essere utilizzato anche per la trascrittomica padrone di casa, progetti di sequenziamento metagenomiche e di scoperta patogeno 1.
Un passaggio fondamentale del protocollo è rivolto RNase H digestione, un alto rendimento, metodo a basso costo per la rimozione di vettore indesiderate e dell'RNA host da campioni virali. Il passo deplezione selettiva del protocollo utilizza molti componenti e richiede abilità e precisione. I tempi supplementari e la cura dovrebbe essere presa durante la configurazione iniziale.
Come la maggior parte dei campioni di siero e plasma clinici hanno spesso molto poco materiale acido nucleico, la contaminazione e la perdita del campione sono comuni. Per evitare questi problemi, particolare attenzione dovrebbe essere presa quando si utilizza questo protocollo. Innanzitutto, RNA è altamente suscettibile alla degradazione; quindi tutte le aree devono essere puliti e privi di nucleasi. In secondo luogo, per identificare i campioni adatti per l'utilizzo in questo protocollo, analisi qRT-PCR sia per l'RNA ospite e virus devono essere utilizzati per la quantificazione 5,6 </sup>. Quando si confrontano ingresso pari con i risultati di sequenziamento del protocollo, il successo sequenziamento (vale a dire, la generazione di dati sufficienti per l'assemblaggio virale pieno) correlati con i campioni che contenevano almeno 100 pg RNA totale e 1.000 copie del virus. Terzo, l'esposizione a fonti ambientali di acidi nucleici deve essere evitato. Il protocollo descritto qui viene eseguita in una cappa di biosicurezza per precauzioni di sicurezza e per limitare contaminanti ambientali. Inoltre, il nostro gruppo e gli altri hanno notato che gli enzimi commerciali possono essere un'altra fonte di contaminazione acidi nucleici batterici in campioni a basso input 6,18. L'utilizzo di uno spazio di lavoro pulito (ad esempio, la PCR cappuccio, armadio biosicurezza) e controlli negativi (ad esempio, acqua o buffer) aiuterà ad alleviare e tenere traccia di contaminazione, rispettivamente. Per i campioni con <100 pg di RNA totale, solo poli (rA) RNA carrier, non rRNA, dovrebbe essere esaurita per garantire risultati di sequenziamento di alta qualità, limitando la perdita di materiale. per moltocampioni di ingresso bassa, metodi cDNA-amplificazione può essere più adatto 19, anche se poly (rA) vettore dovrebbe essere rimosso prima della sintesi del DNA.
L'esaurimento di accoglienza rRNA arricchisce di contenuti virali nelle biblioteche di sequenziamento ed è applicabile alle collezioni di campioni diversi, tra cui siero o plasma, e diversi tipi di tessuti da roditori e primati non umani 5,6. Negli organismi non umani, legge l'allineamento di 28S rRNA è rimasto dopo l'esaurimento, suggerendo 28S rRNA è meno conservato tra gli esseri umani e le altre specie 6,20. Quando si utilizza questo metodo con isolati non-umani, può essere necessario integrare con oligonucleotidi di DNA complementare alle divergenti sequenze rRNA della specifica 3,21 host.
Dal momento che il protocollo è imparziale, virale legge può rappresentare solo una piccola frazione del contenuto totale biblioteca. Anche se rRNA è la specie più abbondante di RNA ospitante e solo una piccola percentuale di rRNA legge (0, 1%) si trovano dopo l'esaurimento selettiva, tutti gli altri RNA host (ad esempio, mRNA) rimarrà dopo l'esaurimento e può spiegare molti sequenziamento legge dal campione. Pertanto "sovracampionamento" (vale a dire, oversequencing) singole biblioteche è necessario al fine di avere una copertura sufficiente per le chiamate di assemblaggio e variante virale. Per i nostri studi, si cerca di sequenza ~ 20 milioni letture per campione di avere abbastanza profondità per l'analisi dei virus e varianti genomiche associate così come il contenuto metagenomica 2,5. Per gli studi di scoperta metagenomiche e patogeni, è importante notare che DNA contaminante host viene rimosso dalla DNasi digestione. Pertanto virus e altri agenti patogeni che contengono genomi di DNA possono essere persi durante il processo, tuttavia intermedi di RNA possono ancora essere sequenziato.
The authors have nothing to disclose.
This work has been funded in part with Federal funds from the National Institutes of Health, Office of Director, Innovator (No.: DP2OD06514) (PCS) and from the National Institute of Allergy and Infectious Diseases, National Institutes of Health, Department of Health and Human Services, under Contracts (No:HHSN272200900018C, HHSN272200900049C and U19AI110818).
96-Well PCR Plates | VWR | 47743-953 | |
Strips of Eight Caps | VWR | 47745-512 | |
Nuclease-free water | Ambion | AM9937 | 50 ml bottle |
TURBO DNase | Ambion | AM2238 | post RNA extraction step, 2 U/µL, buffer included |
PCR cycler | any PCR cyclers | ||
Agencourt RNAClean XP SPRI beads | Beckman Coulter Genomics | A63987 | beads for RNA cleanup |
Real Time qPCR system | any system | ||
DynaMag-96 Side Skirted Magnet | Invitrogen | 12027 | |
70% Ethanol | prepare fresh | ||
qRT-PCR primers | IDT DNA | see Table 2 | |
5M NaCl | Ambion | AM9760G | |
1M Tris-HCl pH 7.4 | Sigma | T2663-1L | |
1M Tris-HCl pH 7.5 | Invitrogen | 15567-027 | |
1M MgCl2 | Ambion | AM9530G | |
Linear acrylamide | Ambion | AM9520 | |
DNA oligos covering entire rRNA region | IDT DNA | see Table 3, order lab-ready at 100 µM | |
Oligo (dT) | IDT DNA | 40 nt long, desalted | |
Hybridase Thermostable RNase H | Epicentre | H39100 | |
RNase-free DNase Kit | Qiagen | 79254 | post selective depletion step |
SUPERase-In RNase Inhibitor | Ambion | AM2694 | |
Random Primers | Invitrogen | 48190-011 | mostly hexamers |
10 mM dNTP mix | New England Biolabs | N0447L | |
SuperScript III Reverse Transcriptase | Invitrogen | 18080-093 | with first-strand buffer, DTT |
Air Incubator | any air incubator cyclers | ||
NEBNext Second Strand Synthesis (dNTP-free) Reaction Buffer | New England Biolabs | B6117S | 10x |
E. coli DNA Ligase | New England Biolabs | M0205L | 10 U/μl |
E. coli DNA Polymerase I | New England Biolabs | M0209L | 10 U/μl |
E. coli RNase H | New England Biolabs | M0297L | 2 U/μl |
0.5M EDTA | Ambion | AM9261 | |
Agencourt AMPure XP SPRI beads | Beckman Coulter Genomics | A63881 | beads for DNA cleanup |
Elution Buffer | Qiagen | 10 mM Tris HCl, pH 8.5 | |
Quant-iT dsDNA HS Assay Kit | Invitrogen | Q32854 | |
Qubit fluorometer | Invitrogen | Q32857 | |
Nextera XT DNA Sample Prep Kit | Illumina | FC-131-1096 | |
Nextera XT DNA Index Kit | Illumina | FC-131-1001 | |
Tapestation 2200 | Agilent | G2965AA | |
High Sensitivity D1000 reagents | Agilent | 5067-5585 | |
High Sensitivity D1000 ScreenTape | Agilent | 5067-5584 | |
BioAnalyzer 2100 | Agilent | G2939AA | |
High Sensitivity DNA reagents | Agilent | 5067-4626 | |
Library Quantification Complete kit (Universal) | Kapa Biosystems | KK4824 | alternative to tapestation, bioanalyzer for library quantification |