Приведен подробный протокол методов дифференциального экспрессионного анализа для секвенирования РНК: limma, EdgeR, DESeq2.
Секвенирование РНК (RNA-seq) является одной из наиболее широко используемых технологий в транскриптомике, поскольку оно может выявить связь между генетическим изменением и сложными биологическими процессами и имеет большое значение в диагностике, прогностике и терапии опухолей. Дифференциальный анализ данных RNA-seq имеет решающее значение для выявления аберрантных транскрипций, а limma, EdgeR и DESeq2 являются эффективными инструментами для дифференциального анализа. Однако дифференциальный анализ RNA-seq требует определенных навыков владения языком R и умения выбирать соответствующий метод, чего не хватает в учебной программе медицинского образования.
Здесь мы предоставляем подробный протокол для идентификации дифференциально экспрессированных генов (DEG) между холангиокарциномой (CHOL) и нормальными тканями через limma, DESeq2 и EdgeR, соответственно, и результаты показаны на графиках вулканов и диаграммах Венна. Три протокола limma, DESeq2 и EdgeR похожи, но имеют разные этапы среди процессов анализа. Например, линейная модель используется для статистики в лимме, в то время как отрицательное биномиальное распределение используется в edgeR и DESeq2. Кроме того, нормализованные данные о количестве РНК-seq необходимы для EdgeR и limma, но не нужны для DESeq2.
Здесь мы предоставляем подробный протокол для трех методов дифференциального анализа: limma, EdgeR и DESeq2. Результаты применения трех методов частично перекрываются. Все три метода имеют свои преимущества, и выбор метода зависит только от данных.
РНК-секвенирование (RNA-seq) является одной из наиболее широко используемых технологий в транскриптомике со многими преимуществами (например, высокой воспроизводимостью данных) и значительно расширило наше понимание функций и динамики сложных биологических процессов1,2. Идентификация аберратных транскриптов в различных биологических контекстах, которые также известны как дифференциально экспрессированные гены (ДЭГ), является ключевым шагом в анализе РНК-seq. RNA-seq позволяет получить глубокое понимание молекулярных механизмов и биологических функций, связанных с патогенезом. Поэтому дифференциальный анализ был расценен как ценный для диагностики, прогностики и терапии опухолей3,4,5. В настоящее время для дифференциального экспресс-анализа РНК-seq разработано больше пакетов R/Bioconductor с открытым исходным кодом, в частности limma, DESeq2 и EdgeR1,6,7. Однако дифференциальный анализ требует определенных навыков владения языком R и умения выбирать подходящий метод, чего не хватает в учебной программе медицинского образования.
В этом протоколе, основанном на данных о количестве РНК-seq холангиокарциномы (CHOL), извлеченных из Атласа генома рака (TCGA), три наиболее известных метода (limma8,EdgeR9 и DESeq210)были проведены, соответственно, программой R11 для идентификации DEG между CHOL и нормальными тканями. Три протокола limma, EdgeR и DESeq2 похожи, но имеют разные этапы среди процессов анализа. Например, нормализованные данные о количестве РНК-seq необходимы для EdgeR и limma8,9, тогда как DESeq2 использует свои собственные библиотечные расхождения для исправления данных вместо нормализации10. Кроме того, edgeR специально подходит для данных RNA-seq, в то время как limma используется для микрочипов и RNA-seq. Линейная модель принята Limma для оценки DEG12,в то время как статистика в edgeR основана на отрицательных биномиальных распределениях, включая эмпирическую оценку Байеса, точные тесты, обобщенные линейные модели и квазивероятностные тесты9.
Таким образом, мы предоставляем подробные протоколы дифференциального экспрессивного анализа RNA-seq с использованием limma, DESeq2 и EdgeR соответственно. Ссылаясь на эту статью, пользователи могут легко выполнить дифференциальный анализ RNA-seq и выбрать подходящие методы дифференциального анализа для своих данных.
Обильные аберратные транскрипты при раке могут быть легко идентифицированы с помощью дифференциального анализа RNA-seq5. Однако применение дифференциального экспрессивного анализа RNA-seq часто ограничено, поскольку оно требует определенных навыков владения языком R и способ?…
The authors have nothing to disclose.
Эта работа была поддержана Национальным фондом естественных наук Китая (грант No 81860276) и Ключевыми проектами Специального фонда Национальной ключевой программы НИОКР (грант No 2018YFC1003200).