This protocol describes a rapid and broadly applicable method for unbiased RNA-sequencing of viral samples from human clinical isolates.
Aquí describimos un protocolo de secuenciación de ARN de última generación que permite a los conjuntos de novo y variantes llamadas intra-anfitriones de los genomas virales obtenidos de fuentes clínicas y biológicas. El método es imparcial y universal; que utiliza cebadores aleatorios para la síntesis de cDNA y no requiere conocimiento previo de la contenido de la secuencia viral. Antes de la construcción de bibliotecas, selectiva digestión a base de RNasa H se utiliza para agotar no deseada de ARN – vehículo que incluye poli (rA) y el ARN ribosomal – a partir de la muestra de ARN viral. depleción selectiva mejora tanto la calidad de los datos y el número de única lee en las bibliotecas de secuenciación del ARN viral. Por otra parte, el paso de una a base de transposasa 'tagmentation' se utiliza en el protocolo, ya que reduce el tiempo total de construcción de la biblioteca. El protocolo ha permitido profunda secuenciación rápida de más de 600 muestras, incluyendo el virus de Lassa y Ebola colecciones de sangre y tejido aislados y es ampliamente aplicable a otros estudios de genómica microbiana.
secuenciación de próxima generación de virus a partir de fuentes clínicas puede informar a la transmisión y la epidemiología de infecciones, así como el apoyo ayuda novela de diagnóstico, y desarrollo de vacunas terapéuticas. la síntesis de ADNc usando cebadores aleatorios ha permitido la detección y el conjunto de los genomas de divergente, co-infectante o incluso nuevos virus 1,2. Al igual que con otros métodos imparciales, los contaminantes no deseados ocupan muchos secuenciación lee y un impacto negativo en los resultados de secuenciación. Anfitrión y poli (rA) ARN transportador son contaminantes presentes en muchas colecciones de muestras virales existentes.
El protocolo describe una forma eficiente y rentable de los genomas de virus de ARN de la secuencia de profundidad sobre la base de imparcial RNA-seq total. El método utiliza una RNasa H paso depleción selectiva 3 para eliminar ribosomal de acogida no deseada y el ARN portador. Depleción selectiva enriquece para el contenido viral (Figura 1) y mejora la calidad general de los datos de secuenciación(Figura 2) a partir de muestras clínicas. Por otra parte, tagmentation se aplica al protocolo, ya que reduce significativamente el tiempo de construcción de la biblioteca. Estos métodos se han utilizado para generar rápidamente grandes conjuntos de datos de Ébola y Lassa genomas de virus 2,4,5 y se pueden utilizar para estudiar una amplia gama de virus de ARN. Por último, el enfoque no se limita a las muestras humanas; la utilidad de la depleción selectiva se demostró en muestras de tejido recogidas de roedores infectados por Lassa y modelos de enfermedad de primates no humanos 5,6.
Figura 1. El ARN total contenido refleja Enriquecimiento del contenido de Lassa virus mediante depleción selectiva. A partir contenido global (entrada de ARN) y el enriquecimiento del virus de Lassa única (LASV) lee (contenido de la Biblioteca) en el agotamiento del ARNr a partir de nueve aislados clínicos diferentes. Esta cifra ha sido modificado a partir de 6 <em>. Haga clic aquí para ver una versión más grande de esta figura.
Figura 2. Calidad Superior Secuenciación Después Carrier RNA agotamiento. Calidades de base mediana de secuenciación por ciclo de poli (rA) contaminadas con el virus de Lassa bibliotecas (rojo) y el control (sin soporte observado en la biblioteca, negro) del informe de control de calidad 13. Ambos leen 1 y 2 de leer extremo emparejado lecturas se fusionan en el archivo de BAM biblioteca y las puntuaciones de calidad se muestran en cada base. Esta cifra ha sido modificado a partir de 6. Por favor, haga clic aquí para ver una versión más grande de esta figura.
El ARN viral siguientes detalles del protocolo de construcción de bibliotecas directamente desde extraídaARN recogido de muestras clínicas y biológicas. Para garantizar la seguridad personal, todas las muestras de suero, plasma y tejidos virales deben ser inactivados en tampones apropiados antes de la extracción de RNA. En algunos kits de inactivación y de extracción, se incluye poli portador (rA) RNA; este será eliminado durante la etapa inicial de agotamiento selectivo de RNasa H. Sobre la base de la recuperación completa, la concentración esperada de ARN portador es 100 ng / l. En el protocolo, 110 ng / l oligo dT ARN (1,1x concentración de portadores) se utiliza para el agotamiento. Si poli (rA) portadora no está presente en la muestra, a continuación, oligo (dT) no se debe añadir antes de agotamiento.
El siguiente protocolo está diseñado para 24 reacciones en formato de placa de PCR (hasta 250 l de volumen). Una versión anterior de este protocolo se informó en Matranga, et al. 6.
El enfoque descrito permite la secuenciación robusto, universal, rápido y fue utilizado para secuenciar el virus del Ébola durante el brote de 2014 2,4. Mediante el acoplamiento de depleción selectiva y la síntesis de ADNc con la construcción de la biblioteca tagmentation, el tiempo de proceso total se redujo en un ~ 2 días a partir de métodos adaptador ligadura anteriores. Más recientemente, este protocolo se empleó por colaboradores internacionales y otros con gran éxito 15,16 y será enviado a los laboratorios en África Occidental para apoyar los estudios de investigación basada en la genómica y diagnóstico local 17.
El protocolo descrito aquí utiliza cebadores aleatorios para preparar cDNA para las bibliotecas de ARN-seq virales. A diferencia de los enfoques de ARN-seq virales anteriores, que no requiere un conocimiento a priori de los datos de secuencia o el diseño de cebadores elaborada y requiere mucho tiempo de un virus o clado específico. El método puede aplicarse a cualquier muestra de ARN viral. Por ejemplo, se utiliza para generar el contenido viral de ambos Ebolay muestras de Lassa 6. El protocolo también se puede usar para transcriptómica anfitrión, proyectos de secuenciación metagenomic y descubrimiento patógeno 1.
Un paso crítico del protocolo está dirigido digestión RNasa H, un alto rendimiento, método de bajo coste para la eliminación de portadora no deseada y el ARN huésped a partir de muestras virales. La etapa de depleción selectiva del protocolo utiliza muchos componentes y requiere habilidad y precisión. tiempo extra y se debe tener cuidado durante la configuración inicial.
Como la mayoría de las muestras de suero y plasma clínicos a menudo tienen muy poco material de ácido nucleico, la contaminación y la pérdida de la muestra son comunes. Para evitar estos problemas, especial se debe tener cuidado al usar este protocolo. En primer lugar, el ARN es altamente susceptible a la degradación; Por lo tanto, todas las áreas deben estar limpias y libres de nucleasas. En segundo lugar, para identificar las muestras adecuadas para su uso en este protocolo, los ensayos de QRT-PCR para ambos ARN del virus de acogida y deben utilizarse para la cuantificación 5,6 </sup>. Cuando se compara con la entrada asciende resultados de la secuenciación del protocolo, el éxito de secuenciación (es decir, la generación de datos suficientes para el ensamblaje viral completo) se correlacionaron con las muestras que contenían al menos 100 pg de ARN total y 1.000 copias del virus. En tercer lugar, la exposición a las fuentes ambientales de los ácidos nucleicos debe ser evitado. El protocolo descrito aquí está hecho en una cabina de bioseguridad como medida de seguridad y para limitar los contaminantes ambientales. Por otra parte, nuestro grupo y otros han dado cuenta de que las enzimas comerciales pueden ser otra fuente de ácidos nucleicos contaminantes bacterianos en muestras de entrada bajas 6,18. El uso de un espacio de trabajo limpio (por ejemplo, PCR capó, cabina de bioseguridad) y controles negativos (por ejemplo, agua o tampón) ayudarán a aliviar y realizar un seguimiento de la contaminación, respectivamente. Para muestras con <100 pg de ARN total, sólo el poli (rA) ARN portador, no rRNA, deberá ser agotado para garantizar resultados de la secuenciación de alta calidad al tiempo que limita la pérdida de material. por muymuestras de entrada bajas, los métodos de amplificación de cDNA pueden ser más adecuados 19, a pesar de poli (rA) portador debe ser eliminado antes de la síntesis de ADNc.
El agotamiento de anfitrión rRNA enriquece para el contenido viral en las bibliotecas de secuenciación y es aplicable a diferentes colecciones de muestras incluyendo suero o plasma, y múltiples tipos de tejidos de roedores y primates no humanos 5,6. En los organismos no humanos, las lecturas alinear a 28S rRNA se mantuvo después de la depleción, lo que sugiere 28S rRNA es menos conservadas entre los seres humanos y otras especies de 6,20. Al utilizar este método con los aislados no humanos, puede ser necesario complementar con oligos de ADN complementarias a las secuencias de rRNA divergentes del 3,21 host específico.
Dado que el protocolo es imparcial, viral lee puede representar sólo una pequeña fracción del contenido total de biblioteca. Aunque rRNA es la especie más abundante de ARN de acogida y sólo un pequeño porcentaje de ARNr (lee0; 1%) se encuentran después de la depleción selectiva, el resto de ARN huésped (por ejemplo, ARNm) se mantendrá después de agotamiento y puede dar cuenta de que muchos de secuenciación lee de la muestra. Por lo tanto "sobremuestreo" (es decir, oversequencing) bibliotecas individuales se requiere con el fin de tener suficiente cobertura para montaje y variantes virales llamadas. Para nuestros estudios, se intenta secuencia de ~ 20 millones de lecturas por muestra para tener suficiente profundidad para el análisis de variantes genómicas y asociadas a virus, así como el contenido de metagenómica 2,5. Para los estudios de descubrimiento metagenomic y patógenos, es importante tener en cuenta que la contaminación de ADN huésped se retira por digestión con DNasa. Por lo tanto virus y otros patógenos que contienen genomas de ADN se pueden perder durante el proceso, sin embargo intermedios de ARN todavía pueden ser secuenciados.
The authors have nothing to disclose.
This work has been funded in part with Federal funds from the National Institutes of Health, Office of Director, Innovator (No.: DP2OD06514) (PCS) and from the National Institute of Allergy and Infectious Diseases, National Institutes of Health, Department of Health and Human Services, under Contracts (No:HHSN272200900018C, HHSN272200900049C and U19AI110818).
96-Well PCR Plates | VWR | 47743-953 | |
Strips of Eight Caps | VWR | 47745-512 | |
Nuclease-free water | Ambion | AM9937 | 50 ml bottle |
TURBO DNase | Ambion | AM2238 | post RNA extraction step, 2 U/µL, buffer included |
PCR cycler | any PCR cyclers | ||
Agencourt RNAClean XP SPRI beads | Beckman Coulter Genomics | A63987 | beads for RNA cleanup |
Real Time qPCR system | any system | ||
DynaMag-96 Side Skirted Magnet | Invitrogen | 12027 | |
70% Ethanol | prepare fresh | ||
qRT-PCR primers | IDT DNA | see Table 2 | |
5M NaCl | Ambion | AM9760G | |
1M Tris-HCl pH 7.4 | Sigma | T2663-1L | |
1M Tris-HCl pH 7.5 | Invitrogen | 15567-027 | |
1M MgCl2 | Ambion | AM9530G | |
Linear acrylamide | Ambion | AM9520 | |
DNA oligos covering entire rRNA region | IDT DNA | see Table 3, order lab-ready at 100 µM | |
Oligo (dT) | IDT DNA | 40 nt long, desalted | |
Hybridase Thermostable RNase H | Epicentre | H39100 | |
RNase-free DNase Kit | Qiagen | 79254 | post selective depletion step |
SUPERase-In RNase Inhibitor | Ambion | AM2694 | |
Random Primers | Invitrogen | 48190-011 | mostly hexamers |
10 mM dNTP mix | New England Biolabs | N0447L | |
SuperScript III Reverse Transcriptase | Invitrogen | 18080-093 | with first-strand buffer, DTT |
Air Incubator | any air incubator cyclers | ||
NEBNext Second Strand Synthesis (dNTP-free) Reaction Buffer | New England Biolabs | B6117S | 10x |
E. coli DNA Ligase | New England Biolabs | M0205L | 10 U/μl |
E. coli DNA Polymerase I | New England Biolabs | M0209L | 10 U/μl |
E. coli RNase H | New England Biolabs | M0297L | 2 U/μl |
0.5M EDTA | Ambion | AM9261 | |
Agencourt AMPure XP SPRI beads | Beckman Coulter Genomics | A63881 | beads for DNA cleanup |
Elution Buffer | Qiagen | 10 mM Tris HCl, pH 8.5 | |
Quant-iT dsDNA HS Assay Kit | Invitrogen | Q32854 | |
Qubit fluorometer | Invitrogen | Q32857 | |
Nextera XT DNA Sample Prep Kit | Illumina | FC-131-1096 | |
Nextera XT DNA Index Kit | Illumina | FC-131-1001 | |
Tapestation 2200 | Agilent | G2965AA | |
High Sensitivity D1000 reagents | Agilent | 5067-5585 | |
High Sensitivity D1000 ScreenTape | Agilent | 5067-5584 | |
BioAnalyzer 2100 | Agilent | G2939AA | |
High Sensitivity DNA reagents | Agilent | 5067-4626 | |
Library Quantification Complete kit (Universal) | Kapa Biosystems | KK4824 | alternative to tapestation, bioanalyzer for library quantification |