Здесь мы представляем протокол для изучения биомаркеров и прогнозирования выживаемости рака молочной железы на основе комплексного анализа Объединенных клинических наборов данных, полученных из различных общедоступных баз данных, используя стратегию выражения, корреляции и анализ выживаемости шаг за шагом.
В последние годы, новые базы данных были разработаны, чтобы снизить барьеры для приближения сложных наборов данных геномных рака, тем самым, облегчая следователям анализировать и интерпретировать гены, образцы и клинические данные между различными типами рака. Здесь мы описываем практическую процедуру операции, принимая ID1 (ингибитор ДНК связывания белков 1) в качестве примера, чтобы охарактеризовать экспрессию моделей биомаркеров и выживания предсказателей рака молочной железы на основе Объединенных клинических наборов данных, полученных из онлайн доступных баз данных, в том числе ONCOMINE, bcGenExMiner v 4.0 (рак молочной железы гена-экспрессия Шахтера v 4.0), GOBO (гена на основе экспрессии исход рака молочной железы онлайн), HPA (человеческий протеин Атлас), и Каплан-Мейер плоттер. Анализ начался с запроса шаблона экспрессии гена интереса (например, ID1) в раковых образцах против нормальных образцов. Затем был выполнен корреляционный анализ между ID1 и клиникопатологическими характеристиками при раке молочной железы. Далее, профили экспрессии ID1 были стратифицированные по разным подгруппам. Наконец, была проанализирована связь между выражением ID1 и исходом на выживание. Операция упрощает концепцию для интеграции многомерных типов данных на генном уровне из различных баз данных и тестовых гипотез относительно рецидивов и геномной связи в случаях изменения генов при раке молочной железы. Этот метод может повысить достоверность и представительность выводов, тем самым, представить информативную перспективу на ген интересов.
Рак молочной железы является неоднородным заболеванием с разнообразными прогнозом и стратегиями лечения в различных молекулярных подтипах, в которых патогенез и развитие, вероятно, связаны с разрозненными молекулярными механизмами1,2 , 3. Однако, определение терапевтической цели обычно занимает годы, или даже десятилетия, от первоначального открытия в фундаментальные исследования для клинического использования4. Широкое применение генома технологии высокой пропускной способности секвенирования для генома рака значительно продвинуло процесс поиска ценных биомаркеров или терапевтических целей 5.
Подавляющее количество генетических данных о раке, генерируемых в результате крупномасштабных систем геномики рака, таких как ICGC (Международный консорциум генома рака) и TCGA (Атлас генома рака), представляет собой большую проблему для исследователей, выполняющих данные Разведка, интеграция и аналитика, особенно для пользователей, которым не хватает интенсивной подготовки по информатике и вычислениям6, 7,8,9,10. В последние годы, новые базы данных, (например, ONCOMINE, bcGenExMiner v 4.0, и Каплан-Мейер плоттер и т.д.) были разработаны и разработаны, чтобы понизить планку для приближения сложных наборов данных геномных рака, тем самым, облегчая следователям анализировать и интерпретировать гены, образцы и клинические данные по различным видам рака11. Цель этого протокола заключается в описании исследовательской стратегии, которая интегрируется с множественными уровнями информации о гене из серии баз данных открытого доступа, которые были широко признаны большим числом исследователей, для выявления потенциальных биомаркеров и прогностических факторов рака молочной железы.
База данных ONCOMINE представляет собой веб-платформу для майнинга данных с информацией о микромассиве рака и предназначена для облегчения открытия новых биомаркеров и терапевтических целей11. В настоящее время существует более 48 000 000 измерений экспрессии генов 65 из наборов данных экспрессии генов в этой базе данных 11, 12. BcGenExMiner v 4.0 (бесплатный инструмент для некоммерческих учреждений), также называемый рак молочной железы гена-выражение Шахтер, является удобной веб-приложение, включающее ДНК микромассивов результаты 3 414 восстановленные больных раком молочной железы и 1 209 опытных уничижительное событие13. Он предназначен для улучшения производительности прогностического анализа генов с R статистического программного обеспечения и пакетов.
GOBO является многофункциональным удобным для пользователя онлайн-инструментом с информацией о микромассивах (например, U133A) из набора клеточных линий рака молочной железы 51 образца и набором данных опухоли молочной железы 1881 образца, который позволяет широкий спектр анализов14. Есть множество приложений, доступных в базе данных GOBO, которые включают в себя быстрый анализ профилей экспрессии генов в различных молекулярных подтипов опухолей молочной железы и клеточных линий, скрининг для совыраженных генов для создания потенциальных метагенес, и Корреляционный анализ между результатами и уровнями экспрессии генов одиночных генов, наборов генов, или подписей генов в наборе данных рака молочной железы15.
Атлас человеческого белка – это программа открытого доступа, предназначенная ученым для изучения протеома человека, которая уже внесла свой вклад в большое количество публикаций в области биологии и болезней человека. Человеческий протеин Атлас признан Европейским основным ресурсом для науки о жизни сообщества16,17.
Плоттер Каплан Мейер это онлайн инструмент интеграции экспрессии генов и клинических данных одновременно, что позволяет оценить прогностический эффект 54 675 генов на основе 10 461 образцов рака, которые включают 1 065 желудка, 2 437 легких, 1 816 яичников и 5 143 больных раком молочной железы со средним последующей 33/49/40/69 месяцев18. Информация о экспрессии генов, безрецидивной выживания (RFS) и общей выживаемости (OS) являются загружаемые из этой базы данных19,20.
Здесь мы описываем практическую процедуру работы с использованием нескольких общедоступных баз данных для сравнения, анализа и визуализации закономерностей изменений в выражении гена заинтересованности в различных исследованиях рака с целью резюмирование Профили выражения, прогностические значения и потенциальные биологические функции при раке молочной железы. Например, недавние исследования показали, что Онкогенные свойства ИДЕНТИФИКАЦИОННЫХ белков в опухолях и были связаны со злокачественными особенностями, включая клеточную трансформацию, увековечивание, усиленное распространение и метастазирование21, 22,23. Тем не менее, каждый член семьи ID играет определенную роль в различных типах твердых опухолей, и их роль в раке молочной железы остается неясным24. В предыдущих исследованиях, исследованных с помощью этого метода, мы обнаружили, что ID1 был значимым прогностическим показателем в раке молочной железы25. Таким образом, протокол будет принимать ID1 в качестве примера для внедрения методов интеллектуального анализа данных.
Анализ начинается с запроса шаблона экспрессии гена интереса к раковым образцам против нормальных образцов в ONCOMINE. Затем, выражение корреляции генов, представляющих интерес в раке молочной железы был выполнен с помощью БК-GenExMiner v 4.0, GOBO, и ONCOMINE. Затем профили экспрессии ID1 были стратифицированные по разным подгруппам с использованием вышеуказанных трех баз данных. Наконец, связь между выражением ID1 и выживание была проанализирована с помощью БК-GenExMiner v 4.0, человеческий протеиновый Атлас, и Каплан-Мейер плоттер. Операция была показана как блок-схема на рисунке 1.
Всесторонний анализ публичных баз данных может указывать на основную функцию гена интересов и выявить потенциальную связь между этим геном и клиникопатологическими параметрами в специфическом раке27,31. Исследование и анализ, основанные на одной единст?…
The authors have nothing to disclose.
Эта работа была частично поддерживается Фондом естественных наук провинции Гуандун, Китай (No. 030313562), учебный проект реформы Гуандунской клинической обучаемой базы (NO. 2016JDB092), Национальный фонд естественных наук Китая (81600358), и молодежный инновационный проект талантов колледжей и университетов в провинции Гуандун, Китай (NO. 2017 KQNCX073)
A personal computer or computing device with an Internet browser with Javascript enabled |
Microsoft | 051690762553 | We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above |
Adobe Flash player | Adobe Systems Inc. | It can be freely downloaded from http://get.adobe.com/flashplayer/. | This browser plug-in is required for visualizing networks on the network analysis tab. |
Chrome Broswer | Google Inc. | It can be freely downloaded from https://www.google.cn/chrome/ | This is necessary for viewing PDF files including the Pathology Reports and many of the downloadable files. |
Java Runtime Environment | Oracle Corporation | It can be downloaded from http://www.java.com/getjava/. | |
Office 365 ProPlus for Faculty | Microsoft | 2003BFFD8117EA68 | This is necessary for viewing the Pathology Reports and for viewing many of the downloadable files. |
Vectr Online | Vectr Labs Inc. | It can be freely used from https://vectr.com/new | This is necessary for visualizing and editing many of the downloadable files and pictures. |