RNA dizilimi için diferansiyel ekspresyon analiz yöntemlerinin ayrıntılı bir protokolü sağlanmıştır: limma, EdgeR, DESeq2.
RNA dizilimi (RNA-seq), genetik değişim ve karmaşık biyolojik süreçler arasındaki ilişkiyi ortaya çıkarabildiği ve tümörlerin tanı, prognostik ve terapötiklerinde büyük değere sahip olduğu için transkriptomikte en yaygın kullanılan teknolojilerden biridir. RNA-seq verilerinin diferansiyel analizi anormal transkripsiyonları tanımlamak için çok önemlidir ve limma, EdgeR ve DESeq2 diferansiyel analiz için etkili araçlardır. Bununla birlikte, RNA-seq diferansiyel analizi, tıp eğitimi müfredatında eksik olan R dili ve uygun bir yöntem seçme yeteneği ile belirli beceriler gerektirir.
Burada, sırasıyla limma, DESeq2 ve EdgeR aracılığıyla kolanjiokarsinom (CHOL) ve normal dokular arasında farklı olarak ifade edilen genleri (DEG’ ler) tanımlamak için ayrıntılı protokol sunuyoruz ve sonuçlar volkan arazilerinde ve Venn diyagramlarında gösteriliyor. Limma, DESeq2 ve EdgeR’ın üç protokolü benzerdir, ancak analiz süreçleri arasında farklı adımlara sahiptir. Örneğin, doğrusal bir model limma istatistikleri için kullanılırken, negatif binom dağılımı edgeR ve DESeq2’de kullanılır. Ayrıca, normalleştirilmiş RNA-seq sayısı verileri EdgeR ve limma için gereklidir, ancak DESeq2 için gerekli değildir.
Burada, üç diferansiyel analiz yöntemi için ayrıntılı bir protokol sunuyoruz: limma, EdgeR ve DESeq2. Üç yöntemin sonuçları kısmen çakışıyor. Her üç yöntemin de kendi avantajları vardır ve yöntem seçimi yalnızca verilere bağlıdır.
RNA dizilimi (RNA-seq), transkriptomikte birçok avantajla (örneğin, yüksek veri tekrarlanabilirliği) en yaygın kullanılan teknolojilerden biridir ve karmaşık biyolojik süreçlerin işlevleri ve dinamikleri hakkında anlayışımızı önemli ölçüde artırmıştır1,2. Farklı olarak ifade edilen genler (DEG’ ler) olarak da bilinen farklı biyolojik bağlam altında sapma transkriptlerinin tanımlanması, RNA-seq analizinde önemli bir adımdır. RNA-seq, patogenezle ilgili moleküler mekanizmaların ve biyolojik fonksiyonların derinlemesine anlaşılmasını mümkün kılar. Bu nedenle, ayırıcı analiz tümörlerin tanı, prognostik ve terapötikleri için değerli olarak kabul edilmiştir3,4,5. Şu anda, RNA-seq diferansiyel ekspresyon analizi için daha açık kaynaklı R / Biyoiletken paketleri geliştirilmiştir, özellikle limma, DESeq2 ve EdgeR1,6,7. Bununla birlikte, diferansiyel analizi, R dili ile belirli beceriler ve tıp eğitimi müfredatında eksik olan uygun yöntemi seçme yeteneğini gerektirir.
Bu protokolde, Kanser Genom Atlası’ndan (TCGA) çıkarılan kolanjiokarsinom (CHOL) RNA-seq sayım verilerine dayanarak, CHOL ve normal dokular arasındaki DEG’leri tanımlamak için R programı11tarafından en bilinen yöntemlerden üçü (sırasıyla limma8, EdgeR9 ve DESeq210) gerçekleştirilmiştir. Limma, EdgeR ve DESeq2’nin üç protokolü benzerdir, ancak analiz süreçleri arasında farklı adımlara sahiptir. Örneğin, normalleştirilmiş RNA-seq sayısı verileri EdgeR ve limma8,9için gereklidir, DESeq2 ise normalleştirme10yerine verileri düzeltmek için kendi kitaplık tutarsızlıklarını kullanır. Ayrıca, edgeR RNA-seq verileri için özel olarak uygundur, limma ise mikroarraylar ve RNA-seq için kullanılır. Doğrusal bir model limma tarafından DEG’leri değerlendirmek için benimsenmiştir12, edgeR’daki istatistikler ampirik Bayes tahmini, kesin testler, genelleştirilmiş doğrusal modeller ve yarı olasılık testleri9dahil olmak üzere negatif binom dağılımlarına dayanmaktadır.
Özetle, sırasıyla limma, DESeq2 ve EdgeR kullanarak RNA-seq diferansiyel ekspresyon analizinin ayrıntılı protokollerini sağlıyoruz. Bu makaleye atıfta bulunarak, kullanıcılar RNA-seq diferansiyel analizini kolayca gerçekleştirebilir ve verileri için uygun diferansiyel analiz yöntemlerini seçebilirler.
Kanserlerde bol miktarda sapma transkriptleri RNA-seq diferansiyel analizi ile kolayca tanımlanabilir5. Bununla birlikte, R dili ile belirli beceriler ve uygun yöntemleri seçme kapasitesi gerektirdiğinden, RNA-seq diferansiyel ifade analizinin uygulanması genellikle kısıtlanır. Bu sorunu gidermek için, en bilinen üç yönteme (limma, EdgeR ve DESeq2) ve RNA-seq diferansiyel ifade çözümlemesi uygulamak için öğreticilere ayrıntılı bir giriş sağlıyoruz. Bu, her üç yöntemdeki …
The authors have nothing to disclose.
Bu çalışma, Çin Ulusal Doğa Bilimleri Vakfı (Grant No. 81860276) ve Ulusal Anahtar Ar-Ge Programının Anahtar Özel Fon Projeleri (Grant No. 2018YFC1003200) tarafından desteklendi.