RNA 시퀀싱을 위한 차동 발현 분석 방법의 상세한 프로토콜이 제공되었다: 림마, EdgeR, DESeq2.
RNA 시퀀싱 (RNA-seq)은 유전 적 변경과 복잡한 생물학적 과정 사이의 관계를 밝힐 수 있으며 종양의 진단, 예후 및 치료에서 큰 가치를 가지고 있기 때문에 전사학에서 가장 널리 사용되는 기술 중 하나입니다. RNA-seq 데이터의 차동 분석은 비정상적인 전사를 식별하는 데 매우 중요하며 림마, EdgeR 및 DESeq2는 차동 분석을 위한 효율적인 도구입니다. 그러나, RNA-seq 차동 분석은 R 언어를 가진 특정 기술과 의학 교육의 교과 과정에서 부족한 적당한 방법을 선택하는 기능이 필요합니다.
본 명세서에서는, 당사는 각각 림마, DESeq2 및 EdgeR을 통해 담랑고아르시노마(CHOL) 및 정상 조직 간의 분화유전자(DEGs)를 식별하고, 그 결과는 화산 플롯및 벤 다이어그램에 도시된다. limma, DESeq2 및 EdgeR의 세 가지 프로토콜은 유사하지만 분석 프로세스 마다 다른 단계가 있습니다. 예를 들어 선형 모델은 림마의 통계에 사용되는 반면 음수 이비알 분포는 edgeR 및 DESeq2에서 사용됩니다. 또한, 정규화된 RNA-seq 카운트 데이터는 EdgeR 및 림마에 필요하지만 DESeq2에는 필요하지 않습니다.
여기서는 림마, EdgeR 및 DESeq2의 세 가지 차동 분석 방법에 대한 자세한 프로토콜을 제공합니다. 세 가지 방법의 결과는 부분적으로 겹칩니다. 세 가지 방법 모두 고유한 장점이 있으며 메서드 선택은 데이터에만 따라 다릅니다.
RNA-시퀀싱(RNA-seq)은 많은 장점(예를 들어, 높은 데이터 재현성)을 가진 전사학에서 가장 널리 사용되는 기술 중 하나이며, 복잡한 생물학적 과정의 기능 및 역학에 대한 이해를 크게증가시켰습니다 1,2. 다른 생물학적 맥락에서 비정상적인 전사체의 식별은 또한 분화 유전자 (DEGs)로 알려져 있으며, RNA-seq 분석에서 중요한 단계입니다. RNA-seq는 병인과 관련된 분자 메커니즘 및 생물학적 기능에 대한 깊은 이해를 얻을 수 있게 합니다. 따라서, 차동 분석은종양의진단, 예후 및 치료에 귀중한 것으로 간주되어 왔다3,4,5. 현재, RNA-seq 차동 발현 분석, 특히 림마, DESeq2 및 EdgeR1,6,7을위해 더 많은 오픈 소스 R/바이오 컨덕터 패키지가 개발되었다. 그러나, 차등 분석은 R 언어와 특정 기술과 의료 교육의 교육 과정에서 부족한 적절한 방법을 선택하는 능력이 필요합니다.
본 프로토콜에서, 암 게놈 아틀라스(TCGA)로부터 추출된 담랑고카르시노마(CHOL) RNA-seq 카운트 데이터를 기반으로, 가장 공지된 방법 중 3개(림마8,EdgeR9 및 DESeq210)가각각 R프로그램에 의해 CHOL과 정상 조직 간의 DEGs를 식별하였다. limma, EdgeR 및 DESeq2의 세 가지 프로토콜은 유사하지만 분석 프로세스 마다 다른 단계가 있습니다. 예를 들어, 정규화된 RNA-seq 카운트 데이터는 EdgeR 및 limma8,9에필요하며, DESeq2는 자체 라이브러리 불일치를 사용하여정규화(10)가아닌 데이터를 수정한다. 더욱이, edgeR은 RNA-seq 데이터에 특히 적합하며, 림마는 마이크로어레이 및 RNA-seq에 사용된다. 선형 모델은 LIMma에 의해 채택되어DEGs(12)를평가하고, edgeR의 통계는 경험적 베이추정, 정확한 테스트, 일반화선형 모델 및 준가능성 시험9을포함한 음수 이난 분포를 기반으로 한다.
요약하자면, 우리는 각각 림마, DESeq2 및 EdgeR을 사용하여 RNA-seq 차동 발현 분석의 상세한 프로토콜을 제공합니다. 이 문서를 참조함으로써 사용자는 RNA-seq 차동 분석을 쉽게 수행하고 데이터에 적합한 차동 분석 방법을 선택할 수 있습니다.
암에 있는 풍부한 수차성 전사체는 RNA-seq 차동 분석에 의해 쉽게 확인할 수 있습니다5. 그러나, RNA-seq 차동 발현 분석의 적용은 R 언어와 적절한 방법을 선택할 수 있는 특정 능력을 필요로 하기 때문에 종종 제한됩니다. 이 문제를 해결하기 위해, 우리는 RNA-seq 차동 발현 분석을 적용하기위한 세 가지 가장 잘 알려진 방법 (limma, EdgeR 및 DESeq2)에 대한 자세한 소개및 자습서를 제공합…
The authors have nothing to disclose.
이 작품은 중국 국립 자연과학 재단(81860276 보조금)과 국가 핵심 R&D 프로그램의 주요 특별 기금 프로젝트(보조금 2018YFC1003200)의 지원을 받았습니다.