This protocol describes a rapid and broadly applicable method for unbiased RNA-sequencing of viral samples from human clinical isolates.
Aqui destacamos um protocolo de sequenciação de RNA de última geração que permite montagens de novo e chamadas variantes intra-hospedeiras de genomas virais recolhidos a partir de fontes clínicas e biológicas. O método é imparcial e universal; que utiliza iniciadores aleatórios para a síntese de cDNA e não necessita de conhecimento prévio do conteúdo sequência viral. Antes da construção da biblioteca, digestão selectiva baseada-H de ARNase é utilizada para esgotar ARN indesejado – transportador incluindo poli (rA) e ARN ribossomal – a partir da amostra de RNA viral. depleção selectiva melhora tanto a qualidade dos dados e o número de exclusivo lê em bibliotecas RNA sequenciamento viral. Além disso, um passo à base de transposase 'tagmentation' é utilizado no protocolo, uma vez que reduz o tempo global de construção da biblioteca. O protocolo permitiu a sequenciação rápida e profunda de mais de 600 amostras-incluindo Lassa e Ebola vírus coleções de sangue e tecido isola-e é amplamente aplicável a outros estudos de genômica microbiana.
geração de sequenciamento próxima de vírus a partir de fontes clínicas pode informar transmissão e epidemiologia das infecções, bem como ajuda o apoio romance de diagnóstico, vacinas e desenvolvimento terapêutico. síntese de cDNA utilizando iniciadores aleatórios permitiu a detecção e montagem de genomas de divergente, co-infectante ou mesmo novos vírus 1,2. Tal como acontece com outros métodos imparciais, contaminantes indesejados ocupam muitos sequenciamento lê e impactar negativamente os resultados de sequenciamento. Host e poli RNA transportador (RA) são contaminantes presentes em muitas colecções de amostras virais existentes.
O protocolo descreve de forma eficiente e rentável de genomas virais de ARN sequenciamento profundas com base em preconceitos RNA-seq total. O método utiliza uma depleção selectiva passo 3 ARNase H para remover ribossomal hospedeiro indesejado e ARN transportador. Depleção selectiva enriquece para conteúdo viral (Figura 1) e melhora a qualidade global dos dados de sequenciação(Figura 2) a partir de amostras clínicas. Além disso, tagmentation é aplicada ao protocolo, uma vez que reduz significativamente o tempo de construção da biblioteca. Estes métodos têm sido usados para gerar rapidamente grandes conjuntos de dados do Ebola e Lassa genomas de vírus 2,4,5 e pode ser usado para estudar uma grande variedade de vírus de ARN. Por último, a abordagem não está limitado a amostras humanas; a utilidade da depleção selectiva foi demonstrada em amostras de tecidos obtidas de roedores de Lassa-infectadas e modelos de doença de primatas não humanos 5,6.
Figura 1. Total de RNA conteúdo reflete Enriquecimento de conteúdo Vírus Lassa Usando Selective esgotamento. A partir conteúdo global (entrada RNA) e enriquecimento do vírus original Lassa (LasV) lê (teor Library) sobre esgotamento rRNA de nove isolados clínicos diferentes. Esta figura foi modificado a partir de 6 <em>. Por favor clique aqui para ver uma versão maior desta figura.
Figura 2. Maior Qualidade Sequencing Após portador RNA Esgotamento. Qualidades de base medianos por ciclo de sequenciação de poli (rA) -contaminated bibliotecas de vírus de Lassa (vermelho) e controle (sem portadora observado na biblioteca, preto) do relatório de QC 13. Tanto ler 1 e leia 2 de final emparelhado lê são mesclados no arquivo BAM biblioteca e os índices de qualidade são mostrados em cada base. Este valor foi modificado a partir do 6. Por favor clique aqui para ver uma versão maior desta figura.
O detalhes do protocolo de construção RNA-seq viral de bibliotecas directamente a partir extraídoARN recolhido a partir de amostras clínicas e biológicas. Para garantir a segurança pessoal, todas as amostras de soro, plasma e tecido virais devem ser inactivado em tampões apropriados antes da extração do RNA. Em alguns kits de inactivação e de extracção, poli transportador ARN (AR) é incluído; este vai ser removida durante o passo inicial depleção selectiva de RNase H. Com base na recuperação completa, a concentração esperada de ARN transportador é de 100 ng / ul. No protocolo, 110 ng / ul de oligo dT de ARN (concentração transportador 1,1x) é usada para depleção. Se poli (rA) portadora não está presente na amostra, em seguida, oligo (dT) não deve ser adicionado antes do esgotamento.
O seguinte protocolo foi concebido para 24 reacções de PCR em formato de placa (até 250 ul de volume). Uma versão anterior deste protocolo foi relatada em Matranga, et al. 6.
A abordagem descrita permite robusta, universal sequenciamento, rápido e foi usado para sequenciar o vírus Ebola durante a 2,4 2.014 surto. Ao acoplar a depleção selectiva de síntese de ADNc e com a construção da biblioteca tagmentation, o tempo total de processo foi reduzida em aproximadamente 2 dias de métodos adaptador de ligação anteriores. Mais recentemente, este protocolo foi empregado por colaboradores internacionais e outros com grande sucesso 15,16 e será implantado em laboratórios na África Ocidental para apoiar estudos de investigação genómica baseada em locais e diagnósticos 17.
O protocolo aqui descrito utiliza iniciadores aleatórios para preparar bibliotecas de ADNc para ARN-SEQ virais. Ao contrário de abordagens de ARN-virais SEQ anteriores, que não requer um conhecimento a priori de dados de sequências ou design elaborado e demorado de iniciadores para um vírus ou subtipo específico. O método pode ser aplicado a qualquer amostra de ARN viral. Por exemplo, ele foi usado para gerar conteúdo viral de ambos Ebolae amostras de Lassa 6. O protocolo também pode ser utilizado para transcriptómica hospedeiro, projectos de sequenciação e detecção de agentes patogénicos metagenomic 1.
Uma etapa fundamental do protocolo é a digestão alvo ARNase H, um de elevado rendimento, o método de baixo custo para a remoção indesejada transportadora e ARN do hospedeiro a partir de amostras virais. O passo de depleção selectiva do protocolo utiliza muitos componentes e requer habilidade e exactidão. tempo e cuidado extra deve ser tomado durante a configuração inicial.
Como a maioria das amostras de soro e plasma clínicos muitas vezes têm muito pouco material de ácido nucleico, contaminação e perda de amostra são comuns. Para evitar esses problemas, cuidados especiais devem ser tomados ao usar este protocolo. Primeiro, o ARN é altamente susceptível à degradação; portanto, todas as áreas devem estar limpas e livres de nucleases. Em segundo lugar, para identificar amostras adequadas para utilização no presente protocolo, ensaios de qRT-PCR para ambos ARN do hospedeiro e vírus deve ser utilizado para quantificação 5,6 </sup>. Quando se compara a entrada com montantes de sequenciação resultados do protocolo de sequenciação, o sucesso (isto é, geração de dados suficientes para a montagem virai completo) correlacionaram-se com as amostras que continham pelo menos 100 pg de RNA total e 1.000 cópias do vírus. Em terceiro lugar, a exposição a fontes ambientais de ácidos nucleicos devem ser evitados. O protocolo descrito aqui é feito de uma cabine de segurança biológica para precauções de segurança e para limitar contaminantes ambientais. Além disso, o nosso grupo e outros têm notado que as enzimas comerciais, podem ser outra fonte de ácidos nucleicos contaminantes bacterianos em amostras de entrada baixa 6,18. O uso de um espaço de trabalho limpo (por exemplo, capô PCR, cabine de segurança biológica) e controlos negativos (por exemplo, água ou tampão) vai ajudar a aliviar e controlar a contaminação, respectivamente. Para amostras com <100 pg de ARN total, apenas de poli (rA) RNA transportador, não ARNr, deve ser esgotado para assegurar resultados de sequenciação de alta qualidade, evitando a perda de material. por muitoamostras de entrada baixas, métodos de amplificação de cDNA pode ser mais adequado 19, apesar de poli (rA) transportador deve ser removido antes da síntese de ADNc.
A depleção de acolhimento rRNA enriquece para conteúdo viral em bibliotecas de sequenciação e é aplicável a diferentes colecções de amostras incluindo plasma ou soro, e vários tipos de tecidos de roedores e primatas não-humanos 5,6. Em organismos não humanos, as leituras de alinhamento 28S rRNA permaneceu após esgotamento, sugerindo 28S rRNA é menos conservada entre humanos e outras espécies de 6,20. Ao utilizar este método com estirpes não-humanos, pode ser necessário para completar, com oligos de ADN complementares às sequências de rRNA 3,21 divergentes do hospedeiro específico.
Como o protocolo é imparcial, viral lê podem representar apenas uma pequena fração do conteúdo total de biblioteca. Embora rRNA é a espécie mais abundante de ARN do hospedeiro e apenas uma pequena percentagem de rRNA lê (0; 1%) são encontrados após a depleção selectiva, todos os outros ARN do hospedeiro (por exemplo, ARNm) permanecerá depois de exaustão e pode ser responsável por muitos sequenciação lê a partir da amostra. Portanto "oversampling" (ou seja, oversequencing) bibliotecas individuais é necessária, a fim de ter uma cobertura suficiente para chamadas de montagem e de variantes virais. Para os nossos estudos, tentamos sequência de ~ 20 milhões de leituras por amostra ter profundidade suficiente para a análise de variantes genômica e associado viral, bem como conteúdo metagenomic 2,5. Para os estudos de descoberta metagenomic e organismos patogénicos, é importante notar que a contaminação de ADN do hospedeiro é removido por digestão de DNase. Por conseguinte, os vírus e outros agentes patogénicos que contêm genomas de ADN podem ser perdidas durante o processo, no entanto intermediários de RNA pode ainda ser sequenciado.
The authors have nothing to disclose.
This work has been funded in part with Federal funds from the National Institutes of Health, Office of Director, Innovator (No.: DP2OD06514) (PCS) and from the National Institute of Allergy and Infectious Diseases, National Institutes of Health, Department of Health and Human Services, under Contracts (No:HHSN272200900018C, HHSN272200900049C and U19AI110818).
96-Well PCR Plates | VWR | 47743-953 | |
Strips of Eight Caps | VWR | 47745-512 | |
Nuclease-free water | Ambion | AM9937 | 50 ml bottle |
TURBO DNase | Ambion | AM2238 | post RNA extraction step, 2 U/µL, buffer included |
PCR cycler | any PCR cyclers | ||
Agencourt RNAClean XP SPRI beads | Beckman Coulter Genomics | A63987 | beads for RNA cleanup |
Real Time qPCR system | any system | ||
DynaMag-96 Side Skirted Magnet | Invitrogen | 12027 | |
70% Ethanol | prepare fresh | ||
qRT-PCR primers | IDT DNA | see Table 2 | |
5M NaCl | Ambion | AM9760G | |
1M Tris-HCl pH 7.4 | Sigma | T2663-1L | |
1M Tris-HCl pH 7.5 | Invitrogen | 15567-027 | |
1M MgCl2 | Ambion | AM9530G | |
Linear acrylamide | Ambion | AM9520 | |
DNA oligos covering entire rRNA region | IDT DNA | see Table 3, order lab-ready at 100 µM | |
Oligo (dT) | IDT DNA | 40 nt long, desalted | |
Hybridase Thermostable RNase H | Epicentre | H39100 | |
RNase-free DNase Kit | Qiagen | 79254 | post selective depletion step |
SUPERase-In RNase Inhibitor | Ambion | AM2694 | |
Random Primers | Invitrogen | 48190-011 | mostly hexamers |
10 mM dNTP mix | New England Biolabs | N0447L | |
SuperScript III Reverse Transcriptase | Invitrogen | 18080-093 | with first-strand buffer, DTT |
Air Incubator | any air incubator cyclers | ||
NEBNext Second Strand Synthesis (dNTP-free) Reaction Buffer | New England Biolabs | B6117S | 10x |
E. coli DNA Ligase | New England Biolabs | M0205L | 10 U/μl |
E. coli DNA Polymerase I | New England Biolabs | M0209L | 10 U/μl |
E. coli RNase H | New England Biolabs | M0297L | 2 U/μl |
0.5M EDTA | Ambion | AM9261 | |
Agencourt AMPure XP SPRI beads | Beckman Coulter Genomics | A63881 | beads for DNA cleanup |
Elution Buffer | Qiagen | 10 mM Tris HCl, pH 8.5 | |
Quant-iT dsDNA HS Assay Kit | Invitrogen | Q32854 | |
Qubit fluorometer | Invitrogen | Q32857 | |
Nextera XT DNA Sample Prep Kit | Illumina | FC-131-1096 | |
Nextera XT DNA Index Kit | Illumina | FC-131-1001 | |
Tapestation 2200 | Agilent | G2965AA | |
High Sensitivity D1000 reagents | Agilent | 5067-5585 | |
High Sensitivity D1000 ScreenTape | Agilent | 5067-5584 | |
BioAnalyzer 2100 | Agilent | G2939AA | |
High Sensitivity DNA reagents | Agilent | 5067-4626 | |
Library Quantification Complete kit (Universal) | Kapa Biosystems | KK4824 | alternative to tapestation, bioanalyzer for library quantification |