We describe a protocol for amplifying retroviral integration sites from the genomic DNA of infected cells, sequencing the amplified virus-host junctions, and then mapping these sequences to a reference genome. We also describe techniques to quantify the distribution of integration sites relative to various genomic annotations using BEDTools.
Retrovirussen vertonen handtekening integratie voorkeuren op zowel de lokale en wereldwijde schaal. Hier presenteren we een gedetailleerd protocol voor (1) genereren van diverse bibliotheken van retrovirale integratieplaatsen middels ligatie-gemedieerde PCR (LM-PCR) amplificatie en de volgende generatie sequencing (NGS), (2) kaart brengen van de genomische locatie van elk virus gastheer junction behulp BEDTools, en (3) het analyseren van de gegevens voor statistische relevantie. Genomisch DNA geëxtraheerd uit geïnfecteerde cellen is gefragmenteerd door digestie met restrictie-enzymen of door sonicatie. Na geschikte DNA end-reparatie, zijn double-stranded linkers geligeerd op de DNA-uiteinden en semi-nested PCR wordt uitgevoerd met primers die complementair zijn aan zowel de lange terminale herhaling (LTR) uiteinde van het virus en de geligeerde linker DNA. De PCR primers dragen sequenties die vereist zijn voor DNA-clustering in NGS, teniet de behoefte aan apart adapter ligatie. Kwaliteitscontrole (QC) is uitgevoerd om DNA-fragment grootteverdeling evalueren en aanpassener DNA opname voorafgaand aan de NGS. Sequence output bestanden worden gefilterd voor LTR-bevattende leest, en de sequenties definiëren van de LTR en de linker zijn weg afgesneden. Bijgesneden gastheercel sequenties worden toegewezen aan een referentie genoom behulp BLAT en gefilterd voor minimaal 97% identiteit met een unieke plaats in de referentie genoom. Unieke integratieplaatsen worden onderzocht voor aangrenzende nucleotide (nt) sequentie en distributie ten opzichte van verschillende genomische functies. Met dit protocol, kan integratieplaats bibliotheken met hoge complexiteit worden geconstrueerd uit genomisch DNA in drie dagen. De gehele protocol dat exogene virale infectie van gevoelige weefselkweek cellen integratieplaats analyse omvat kan derhalve worden uitgevoerd bij ongeveer 1-2 weken. Recente toepassingen van deze technologie hebben betrekking op longitudinale analyse van de integratie sites uit HIV-geïnfecteerde patiënten.
Integratie van viraal DNA (vDNA) in het gastheergenoom is een essentiële stap in de virale levenscyclus. Integratie wordt bereikt door het virale enzym integrase (IN), die zich bezighoudt met twee verschillende katalytische processen die leiden tot de oprichting van een stabiel ingebracht provirus 1. IN subeenheden aangrijpen op de uiteinden van de lineaire vDNA dat wordt gegenereerd door middel van reverse transcriptie, die de hogere orde intasome met vDNA uiteinden samengehouden door een IN multimeer 2-4. IN splitst de 3 'einden van het vDNA stroomafwaarts van invariante 5'-CA-3' sequenties in een proces dat 3'-verwerking, het verlaten verzonken 3'-uiteinden met reactieve hydroxylgroepen op elk uiteinde vDNA 5-8. De intasome wordt vervolgens in de kern ingevoerd als deel van een grote verzameling van gastheer en virale proteïnen bekend als de preintegration complex (PIC) 9-11. Na het ontmoeten van cellulaire doelwit DNA (TDNA), IN gebruikt de vDNA 3'-hydroxyl groups om de TDNA boven- en onderkant strengen in een versprongen wijze aanhangen en tegelijkertijd voegt zich bij de vDNA om TDNA 5 'fosfaatgroepen door het proces van het strand transfer 12,13.
Retrovirussen vertonen integratie voorkeuren voor websites op de lokale en wereldwijde schaal. Lokaal, consensus integratie plaatsen bestaan uit zwak geconserveerde palindroom TDNA sequenties die variëren van ongeveer 5-10 bp stroomopwaarts als stroomafwaarts van de vDNA insertieplaatsen 14,15. Wereldwijd retrovirussen richten zich op specifieke chromatine annotaties 16. Er zijn zeven verschillende retrovirale genera – alfa door middel van epsilon, Lenti, en spuma. De lentivirussen, die HIV-1 omvatten, gunst integratie binnen de lichamen van actief getranscribeerd genen 17, terwijl de gammaretrovirussen voorkeur te integreren in de transcriptie start sites (Tsss) en actieve versterker regio's 18-20. In scherp contrast, is spumavirus sterk neigt in de richting heterochromATIC regio's, zoals gen-arme-lamina bijbehorende domeinen 21. Lokale TDNA base voorkeuren zijn voor een groot deel bepaald door de specifieke netwerken van nucleoproteïne contacten tussen IN en TDNA 13,22,23. Voor de lentivirussen en gammaretrovirussen, integratie ten opzichte van genomische annotaties is voor een groot deel bepaald door de interactie tussen IN en verwante cellulaire factoren 24-27. Het veranderen van de specifieke kenmerken van de IN-TDNA interactie netwerk 13,22,23,28 en verstoren of re-engineering IN-host-factor interacties 25-27,29-32 zijn bewezen strategieën om de integratie retarget op lokaal en mondiaal niveau, respectievelijk.
De kracht van DNA sequencing procedures gebruikt aan catalogus retrovirale integratieplaatsen is enorm in de afgelopen decennia. Integratie sites werden teruggevonden in baanbrekende werk met behulp van bewerkelijke zuivering en handmatige kloontechnieken tot slechts een handvol unieke locaties per studie 33,34 opleveren.De combinatie van LM-PCR amplificatie van LTR-gastheer-DNA kruispunten met de mogelijkheid om afzonderlijke integratieplaatsen voor mens en muis ontwerp genomen veranderde het gebied in kaart met het aantal sites gewonnen uit exogene weefselkweek cellen infecties verhogen tot enkele honderden tot duizenden 17 , 18. De meer recente combinatie van LM-PCR met NGS methodologie bibliotheek diepte rijzen de pan uit gestuurd. Specifiek, pyrosequencing leverde in de orde van tienduizenden unieke integratieplaatsen 30,35-38, terwijl bibliotheken gesequentieerd met behulp van DNA clustervorming miljoenen unieke sequenties 19-21,39 verkregen. Hier beschrijven we een geoptimaliseerde LM-PCR-protocol voor het versterken en het sequencen van retrovirale integratie sites met behulp van DNA-clustering NGS. De werkwijze omvat benodigde adapter sequenties in de PCR primers en dus rechtstreeks in de geamplificeerde DNA-moleculen, waardoor de vereiste weg staat tegen adapter ligatie stap vóór sequencing 40. De bio-informatica-analyse pijpleiding van het parseren van ruwe sequentiegegevens voor LTR-gastheer-DNA junctions het in kaart brengen van unieke integratieplaatsen genomisch features relevant, wordt ook algemeen beschreven. Overeenkomstig de vastgestelde stand van methodologische voorschriften dit gebied 36,38,41-43 voorrang, kunnen aangepaste scripts worden ontwikkeld om de voltooiing van de specifieke stappen in de bioinformatica pijplijn helpen. Het nut en de gevoeligheid van het protocol wordt geïllustreerd met representatieve gegevens door amplificatie, sequencing, en afbeelden van HIV-1 integratieplaatsen van weefselkweek cellen geïnfecteerd met de multipliciteit van infectie (MOI) van 1,0, en een titratiereeks van dit DNA verdund met ongeïnfecteerde cellulair DNA in 5-voudige stappen hoogste verdunning van 1: 15.625 tot bij benadering equivalente MOI opbrengst van 6,4 x 10 -5.
Een protocol voor de analyse van retrovirale integratieplaatsen, de initiële virusinfectie stap door de omschrijving van genomische verspreidingspatronen wordt beschreven. Dit protocol is toepasbaar op elk retrovirus geïnfecteerd en elk celtype. Bovendien is de assay pijpleiding is zeer gevoelig, met de potentie om een bevredigend aantal unieke integratieplaatsen van seriële verdunningen van genomisch DNA overeenkomt herstellen tot die van een infectie gestart met een MOI van 6,4 x 10 -5. Deze gevoeligheid…
The authors have nothing to disclose.
We zijn dankbaar dat onze collega Stephen Hughes en Henry Levin voor het advies dat van cruciaal belang voor de NGS protocol voor retrovirale integratie ter sequencing te vestigen in de Engelman lab was. Dit werk werd ondersteund door de Amerikaanse National Institutes of Health subsidies AI039394 en AI052014 (tot ANE) en AI060354 (Harvard University Center for AIDS Research).
DMEM | Gibco | 11965-084 | Standard cell culture medium, compatible with HEK293T cells |
Fetal Bovine Serum | Thermo Scientific | SH 30088.03 | Different lots of serum may need to be pre-screened for optimal viral production |
Penicillin/Streptomycin | Corning | 30-002-Cl | Antibiotics to be added to DMEM |
Phosphate-buffered saline | Mediatech | 21-040-CV | Used to wash cells |
Trypsin EDTA | Corning | 25-053-CI | Used to detach adherent cells from tissue culture plates |
PolyJet | SignaGen Laboratories | SL100688 | DNA transfection reagent |
0.45 µm Filters | Thermo Scientific | 09-740-35B | Used to filter virus particle-containing cell culture media |
Turbo DNase | Ambion | AM2239 | Used to degrade carryover plasmid DNA from virus stocks |
HIV-1 p24 Antigen Capture Assay | ABL Inc. | 5447 | Used to quantify yield of virus production |
DNeasy Blood & Tissue Kit | Qiagen | 69506 | Used to purify genomic DNA from cells |
Sonicator | Covaris | S2 | With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec |
Nuclease-Free Water | GeneMate | G-3250-125 | Commercially-available water is recommended to reduce the possibility of sample cross-contamination |
QIAQuick PCR Purification Kit | Qiagen | 28106 | Used to purify DNA during library construction |
End-It DNA End-Repair Kit | Epicentre | ER81050 | Used to repair DNA ends of sonicated DNA samples |
Klenow Fragment (3'-5' exo–) | New England Biolabs (NEB) | M0212S | Used with dATP to A-tail repaired DNA fragments |
dATP | Thermo Scientific | R0141 | Deoxyadenosine triphosphate |
MseI | NEB | R0525L | Restriction endonuclease for genomic DNA cleavage |
BglII | NEB | R0144L | Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence |
T4 DNA Ligase | NEB | M0202L/6218 | Enzyme for covalent joining of compatible DNA ends |
DNA Oligonucleotides | Integrated DNA Technologies | custom | Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs |
Advantage 2 Polymerase Mix | Clontech | 639202 | Commercial mix containing DNA polymerase for PCR |
dNTPs (100 mM solutions) | Thermo Scientific | R0181 | Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP |
NanoDrop | Thermo Scientific | NanoDrop 2000 | Spectrophotometer for determination of DNA concentration |
Qubit Fluorimeter | Life Technologies | Qubit® 3.0 | Fluorometer used to confirm integration site library DNA concentration |
2200 TapeStation System | Agilent | G2964AA | Tape-based assay to confirm integration site library DNA size distribution |
MiSeq | Illumina | SY-410-1003 | Used for NGS |