Summary

호스트-병원체 상호 작용을 조사하기 위한 고처리량 전사 분석

Published: March 05, 2022
doi:

Summary

여기에 제시된 프로토콜은 고급 통계 분석 접근법에 품질 관리 및 전처리 단계를 포함하여 원시 읽기에서 기능 분석에 RNA-시퀀싱 전사 데이터를 분석하는 완전한 파이프라인을 설명합니다.

Abstract

병원균은 다양한 전염병을 일으킬 수 있습니다. 감염에 응하여 숙주에 의해 유도된 생물학적 과정은 질병의 중증도를 결정한다. 이러한 프로세스를 연구하기 위하여는, 연구원은 감염, 임상 결과, 또는 질병 엄격의 다른 단계에서 호스트 전사의 동적 변경을 측정하는 고처리량 시퀀싱 기술 (RNA-seq)를 사용할 수 있습니다. 이 조사는 질병의 더 나은 이해로 이어질 수 있습니다., 잠재적인 약물 목표 와 치료를 발견 뿐만 아니라. 여기에 제시된 프로토콜은 원시 읽기에서 기능 분석에 RNA 시퀀싱 데이터를 분석하는 완벽한 파이프라인을 설명합니다. 파이프라인은 데이터의 (1) 품질 관리라는 다섯 단계로 나뉩니다. (2) 유전자의 매핑 및 인장; (3) 분화 유전자 및 공동 발현 유전자를 식별하는 통계 분석; (4) 시료의 섭란의 분자 정도의 결정; 및 (5) 기능 분석. 1단계는 다운스트림 분석의 품질에 영향을 줄 수 있는 기술 아티팩트를 제거합니다. 2단계에서 유전자는 표준 라이브러리 프로토콜에 따라 매핑되고 추가됩니다. 3단계의 통계 분석은 감염된 샘플에서 분화되거나 공동 발현되는 유전자를 비감염된 샘플과 비교하여 식별합니다. 시료 가변성 및 잠재적인 생물학적 이상치의 존재는 4단계에서 의 분자 정도의 교란 접근법을 사용하여 검증된다. 마지막으로, 5단계에서의 기능적 분석은 질병 표현형과 관련된 경로를 나타낸다. 제시된 파이프라인은 숙주 병원체 상호 작용 연구에서 RNA-seq 데이터 분석을 통해 연구원을 지원하고 감염의 분자 메커니즘을 이해하는 데 필수적인 시험관 또는 생체 내 실험에서 미래를 추진하는 것을 목표로 합니다.

Introduction

뎅기열, 황열병, 치쿤구냐 및 지카와 같은 Arboviruses는 여러 발병과 널리 연관되어 있으며 지난 수십 년 동안 인간을 감염시키는 주요 병원체 중 하나로 부상했습니다1,2. 치쿤구냐 바이러스(CHIKV)에 감염된 개인은 종종 발열, 두통, 발진, 폴리아르트랄기아 및 관절염3,4,5명이 있다. 바이러스는 세포의 유전자 발현을 전복시키고 각종 숙주 신호 경로에 영향을 미칠 수 있습니다. 최근에는 혈액 전사체 연구를 활용하여 급성 CHIKV 감염과 관련된 분화 유전자(DEGs)를 확인하기 위해 RNA-seq를 활용하여 회복6 또는 건강한 대조군7과 비교하여. CHIKV 감염된 아이들은 바이러스성 RNA를 위한 세포 센서와 관련되었던 것과 같은 선천적인 면역에 관여하는 up-regulated 유전자를 가지고 있었습니다, JAK/STAT 신호, 및 수신과 같은 수용체 신호 통로6. CHIKV에 급성 감염된 성인은 또한 단핵구 및 수지상 세포 활성화와 관련된 유전자와 같은 선천성 면역과 관련된 유전자의 유도를 보여주었으며, 항바이러스 반응7. 다운 조절 유전자로 농축된 신호 경로는 T 세포 활성화 및 T 및 B 세포7에 있는 분화 및 농축과 같은 적응성 면역과 관련되었던 그들 포함했습니다7.

몇몇 방법은 숙주 및 병원체 유전자의 전사 데이터를 분석하기 위하여 이용될 수 있습니다. 종종 RNA-seq 라이브러리 준비는 성숙한 폴리-A 성적 증명서의 농축으로 시작됩니다. 이 단계는 리보솜 RNA (rRNA)의 대부분을 제거하고 일부 경우 바이러스 / 세균 RNA를 제거합니다. 그러나, 생물학적 질문이 병원체 전사 검출및 RNA가 이전 선택과 무관하게 서열화될 때, 다른 많은 성적증명서는 시퀀싱에 의해 검출될 수 있었다. 예를 들어, subgenomic mRNAs는 질병의 중증도를 확인하는 중요한 요소로 표시되었다8. 또한, CHIKV 및 SARS-CoV-2와 같은 특정 바이러스의 경우 폴리A 농축 라이브러리조차도 다운스트림 분석에서 활용할 수 있는 바이러스 판독을 생성합니다9,10. 숙주 전사의 분석에 초점을 맞출 때, 연구원은 견본을 통해 생물학 동요를 조사하고, 분화한 유전자 및 농축된 통로를 확인하고, 공동 발현 모듈7,11,12를 생성할 수 있습니다. 이 프로토콜은 다른 생물 정보 학적 접근 방식을 사용하여 CHIKV 감염 환자 및 건강한 개인의 전사 분석을 강조 (그림 1A). 이전에 발표된 연구에서 얻은 데이터7은 20명의 건강하고 39개의 CHIKV로 구성되어 급성 감염된 개인이 대표적인 결과를 생성하는 데 사용되었습니다.

Protocol

이 프로토콜에 사용된 견본은 상파울루 대학에 생물 의학 과학의 생물학과 및 세르지페의 연방 대학의 미생물학의 학과에서 윤리 위원회에 의해 승인되었습니다 (의정서: 54937216.5.5.5467 및 54835916.5546, 각각). 1. Docker 데스크톱 설치 참고: Docker 환경을 준비하는 단계는 운영 체제(OS)와 다릅니다. 따라서 Mac 사용자는 1.1로 나열된 단계를 수행해야 ?…

Representative Results

전사 분석을 위한 컴퓨팅 환경이 Docker 플랫폼에서 만들어지고 구성되었습니다. 이 방법을 사용하면 초보자 Linux 사용자가 사전 관리 지식없이 Linux 터미널 시스템을 사용할 수 있습니다. Docker 플랫폼은 호스트 OS의 리소스를 사용하여 특정 사용자의 도구가 포함된 서비스 컨테이너(그림 1B)를 만듭니다. Linux OS 우분투 20.04 배포판을 기반으로 하는 컨테이너가 만들어졌으며, 명…

Discussion

시퀀싱 라이브러리를 준비하는 것은 생물학적 질문에 가능한 최선의 방법으로 답변하는 중요한 단계입니다. 연구의 관심성적증명서 유형은 어떤 유형의 시퀀싱 라이브러리를 선택하고 생물정보 분석을 유도할 것인지를 안내합니다. 예를 들어, 병원체 및 숙주 상호작용의 시퀀싱으로부터, 시퀀싱의 유형에 따라, 호스트 전사체 모두에서 또는 바로 서열을 식별할 수 있다.

차?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

HN은 FAPESP(교부금 번호: #2017/50137-3, 2012/19278-6, 2018/14933-2, 2018/21934-5, 2013/08216-2) 및 CNPq(313662/2017-7)에 의해 지원됩니다.

ANAG (FAPESP 프로세스 2019/13880-5), VEM (FAPESP 프로세스 2019/16418-0), IMSC (FAPESP 프로세스 2020/05284-0), APV (FAPESP 프로세스 2019/2019/27146) RLTO (CNPq 프로세스 134204/2019-0).

Materials

CEMiTool Computational Systems Biology Laboratory 1.12.2 Discovery and the analysis of co-expression gene modules in a fully automatic manner, while providing a user-friendly HTML report with high-quality graphs.
EdgeR Bioconductor (Maintainer: Yunshun Chen [yuchen at wehi.edu.au]) 3.30.3 Differential expression analysis of RNA-seq expression profiles with biological replication
EnhancedVolcano Bioconductor (Maintainer: Kevin Blighe [kevin at clinicalbioinformatics.co.uk]) 1.6.0 Publication-ready volcano plots with enhanced colouring and labeling
FastQC Babraham Bioinformatics 0.11.9 Aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing
FeatureCounts Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research 2.0.0 Assign mapped sequencing reads to specified genomic features
MDP Computational Systems Biology Laboratory 1.8.0 Molecular Degree of Perturbation calculates scores for transcriptome data samples based on their perturbation from controls
R R Core Group 4.0.3 Programming language and free software environment for statistical computing and graphics
STAR Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research 2.7.6a Aligner designed to specifically address many of the challenges of RNA-seq data mapping using a strategy to account for spliced alignments
Bowtie2 Johns Hopkins University 2.4.2 Ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences
Trimmomatic THE USADEL LAB 0.39 Trimming adapter sequence tasks for Illumina paired-end and single-ended data
Get Docker Docker 20.10.2 Create a bioinformatic environment reproducible and predictable (https://docs.docker.com/get-docker/)
WSL2-Kernel Windows NA https://docs.microsoft.com/en-us/windows/wsl/wsl2-kernel
Get Docker Linux Docker NA https://docs.docker.com/engine/install/ubuntu/
Docker Linux Repository Docker NA https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository
MDP Website Computational Systems Biology Laboratory NA https://mdp.sysbio.tools
Enrichr Website MaayanLab NA https://maayanlab.cloud/Enrichr/
webCEMiTool Computational Systems Biology Laboratory NA https://cemitool.sysbio.tools/
gProfiler Bioinformatics, Algorithmics and Data Mining Group NA https://biit.cs.ut.ee/gprofiler/gost
goseq Bioconductor (Maintainer: Matthew Young [my4 at sanger.ac.uk]) NA http://bioconductor.org/packages/release/bioc/html/goseq.html
SRA NCBI study NCBI NA https://www.ncbi.nlm.nih.gov/bioproject/PRJNA507472/

References

  1. Weaver, S. C., Charlier, C., Vasilakis, N., Lecuit, M. Zika, Chikungunya, and Other Emerging Vector-Borne Viral Diseases. Annual Review of Medicine. 69, 395-408 (2018).
  2. Burt, F. J., et al. Chikungunya virus: an update on the biology and pathogenesis of this emerging pathogen. The Lancet. Infectious Diseases. 17 (4), 107-117 (2017).
  3. Hua, C., Combe, B. Chikungunya virus-associated disease. Current Rheumatology Reports. 19 (11), 69 (2017).
  4. Suhrbier, A., Jaffar-Bandjee, M. -. C., Gasque, P. Arthritogenic alphaviruses-an overview. Nature Reviews Rheumatology. 8 (7), 420-429 (2012).
  5. Nakaya, H. I., et al. Gene profiling of chikungunya virus arthritis in a mouse model reveals significant overlap with rheumatoid arthritis. Arthritis and Rheumatism. 64 (11), 3553-3563 (2012).
  6. Michlmayr, D., et al. Comprehensive innate immune profiling of chikungunya virus infection in pediatric cases. Molecular Systems Biology. 14 (8), 7862 (2018).
  7. Soares-Schanoski, A., et al. Systems analysis of subjects acutely infected with the Chikungunya virus. PLOS Pathogens. 15 (6), 1007880 (2019).
  8. Alexandersen, S., Chamings, A., Bhatta, T. R. SARS-CoV-2 genomic and subgenomic RNAs in diagnostic samples are not an indicator of active replication. Nature Communications. 11 (1), 6059 (2020).
  9. Wang, D., et al. The SARS-CoV-2 subgenome landscape and its novel regulatory features. Molecular Cell. 81 (10), 2135-2147 (2021).
  10. Wilson, J. A. C., et al. RNA-Seq analysis of chikungunya virus infection and identification of granzyme A as a major promoter of arthritic inflammation. PLOS Pathogens. 13 (2), 1006155 (2017).
  11. Gonçalves, A. N. A., et al. Assessing the impact of sample heterogeneity on transcriptome analysis of human diseases using MDP webtool. Frontiers in Genetics. 10, 971 (2019).
  12. Russo, P. S. T., et al. CEMiTool: a Bioconductor package for performing comprehensive modular co-expression analyses. BMC Bioinformatics. 19 (1), 56 (2018).
  13. Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12 (12), 0190152 (2017).
  14. Seyednasrollah, F., Laiho, A., Elo, L. L. Comparison of software packages for detecting differential expression in RNA-seq studies. Briefings in Bioinformatics. 16 (1), 59-70 (2015).
  15. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
  16. Cheng, C. W., Beech, D. J., Wheatcroft, S. B. Advantages of CEMiTool for gene co-expression analysis of RNA-seq data. Computers in Biology and Medicine. 125, 103975 (2020).
  17. Cardozo, L. E., et al. webCEMiTool: Co-expression modular analysis made easy. Frontiers in Genetics. 10, 146 (2019).
  18. de Lima, D. S., et al. Long noncoding RNAs are involved in multiple immunological pathways in response to vaccination. Proceedings of the National Academy of Sciences of the United States of America. 116 (34), 17121-17126 (2019).
  19. Prada-Medina, C. A., et al. Systems immunology of diabetes-tuberculosis comorbidity reveals signatures of disease complications. Scientific Reports. 7 (1), 1999 (2017).
  20. Chen, E. Y., et al. Enrichr: interactive and collaborative HTML5 gene list enrichment analysis tool. BMC Bioinformatics. 14, 128 (2013).
  21. Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
  22. Raudvere, U., et al. g:Profiler: a web server for functional enrichment analysis and conversions of gene lists (2019 update). Nucleic Acids Research. 47, 191-198 (2019).
  23. Young, M. D., Wakefield, M. J., Smyth, G. K., Oshlack, A. Gene ontology analysis for RNA-seq: accounting for selection bias. Genome Biology. 11 (2), 14 (2010).

Play Video

Cite This Article
Aquime Gonçalves, A. N., Escolano Maso, V., Maia Santos de Castro, Í., Pereira Vasconcelos, A., Tomio Ogava, R. L., I Nakaya, H. High-Throughput Transcriptome Analysis for Investigating Host-Pathogen Interactions. J. Vis. Exp. (181), e62324, doi:10.3791/62324 (2022).

View Video