Hier stellen wir ein Protokoll vor, um den Biomarker und den Überlebensprediger von Brustkrebs zu erforschen, das auf der umfassenden Analyse von gebündelten klinischen Datensätzen basiert, die aus einer Vielzahl von öffentlich zugänglichen Datenbanken abgeleitet werden, und dabei die Strategie des Ausdrucks, der Korrelation und Überlebensanalyse Schritt für Schritt.
In den letzten Jahren wurden neue Datenbanken entwickelt, um die Barrieren für die Annäherung an die experimentellen genetischen Daten des Krebses zu verringern und damit den Forschern die Möglichkeit zu geben, Gene, Proben und klinische Daten über verschiedene Krebsarten zu analysieren und zu interpretieren. Hier beschreiben wir ein praktisches Operationsverfahren, bei dem ID1 (Inhibitor von DNA-Bindungsproteinen 1) als Beispiel die Expressionsmuster von Biomarker und Überlebensvorhersagen von Brustkrebs anhand von gebündelten klinischen Datensätzen, die von gebündelten klinischen Datensätzen abgeleitet werden, charakterisiert werden. Online-zugängliche Datenbanken, darunter ONCOMINE, bcGenExMiner v4.0 (Brustkrebs-Gen-Ausdruck miner v4.0), GOBO (Gene expression-basiertes Outcome for Breast cancer Online), HPA (Der menschliche Proteinatlas) und Kaplan-Meier Plotter. Die Analyse begann mit der Abfrage des Ausdrucksmusters des Gens von Interesse (z.B. ID1) bei Krebsproben vs. normalen Proben. Anschließend wurde die Korrelationsanalyse zwischen ID1 und klinikathologischen Merkmalen bei Brustkrebs durchgeführt. Als nächstes wurden die Expressionsprofile von ID1 nach verschiedenen Untergruppen geschichtet. Schließlich wurde der Zusammenhang zwischen ID1-Ausdruck und Überlebensergebnis analysiert. Das Operationsverfahren vereinfacht das Konzept, multidimensionale Datentypen auf der Genebene aus verschiedenen Datenbanken und Testhypothesen auf Rezidiven und genomischen Kontext von Genveränderungsereignissen bei Brustkrebs zu integrieren. Diese Methode kann die Glaubwürdigkeit und Repräsentativität der Schlussfolgerungen verbessern und damit eine informative Perspektive auf ein Gen von Interesse bieten.
Brustkrebs ist eine heterogene Erkrankung mit unterschiedlichen Prognose-und Behandlungsstrategien in verschiedenen molekularen Subtypen, bei der die Pathogenese und-entwicklung wahrscheinlich mit unterschiedlichen molekularen Mechanismen 1, 2 in Verbindung gebracht werden. , 3. Die Identifizierung eines therapeutischen Ziels dauert jedoch in der Regel Jahre oder sogar Jahrzehnte, von der ersten Entdeckung in derGrundlagenforschung bis zur klinischen Anwendung 4. Die genomweite Anwendung der Hochdurchsatz-Sequenzierungstechnologie für Krebsgenom hat den Prozess der Suche nach wertvollen Biomarkern oder therapeutischen Zielen 5 stark vorangetrieben.
Die überwältigende Menge an Krebsgenomik-Daten, die von den großen Krebs-Genomik-Plattformen wie dem ICGC (International Cancer Genome Consortium) und dem TCGA (The Cancer Genome Atlas) generiert werden, stellt die Forscher vor eine große Herausforderung, Daten durchzuführen. Exploration, Integration und Analytik, insbesondere für Anwender, die nicht intensiv in Informatik und Berechnung 6,7, 8,9,10. In den letzten Jahren wurden neue Datenbanken (z.B. ONCOMINE, bcGenExMiner v4.0 und Kaplan-Meier Plotter, etc.) entwickelt und entwickelt, um die Messlatte für die Annäherung an die komplexen genetischen Daten des Krebses zu senken und so den Forschern die Analyse zu erleichtern und Interpretieren Sie die Gene, Proben und klinischen Daten über verschiedene Krebsarten 11. Ziel dieses Protokolls ist es, eine Forschungsstrategie zu beschreiben, die mit mehreren Ebenen von Geninformationen aus einer Reihe von Open-Access-Datenbanken integriert ist, die von einer Vielzahl von Forschern weithin anerkannt wurden, um die potenziellen Biomarker zu identifizieren und Prognostische Faktoren für Brustkrebs.
Die ONCOMINE Datenbank ist eine webbasierte Data-Mining-Plattform mit Krebs-Mikroarray-Informationen und soll die Entdeckung neuartiger Biomarker und therapeutischer Ziele11 erleichtern. Derzeit gibt es in dieser Datenbank 11,12mehr als 48 Millionen Genexpressionsmessungen von 65Genexpressionsdatensätzen. Die bcGenExMiner v4.0 (ein kostenloses Tool für gemeinnützige Einrichtung), auch Brustkrebs Gene-Expression Miner genannt, ist eine benutzerfreundliche webbasierte Anwendung, die DNA-Mikroarrays Ergebnisse von 3.414 erholten Brustkrebspatientinnen enthält und 1.209 Erfahrungen erlebten. Abstimmungsvolle Veranstaltung13. Es wurde entwickelt, um die Leistung der genetischen Prognoseanalyse mit statistischer Software und-Paketen zu verbessern.
Das GOBO ist ein multifunktionales, benutzerfreundliches Online-Tool mit Mikroarrox-Informationen (z.B. Affymetrix U133A) aus einem 51-Proben-Brustkrebszellensatz und einem 1881-Proben-Brusttumordatensatz, der eine Vielzahl von Analysen ermöglicht 14. In der GOBO-Datenbank gibt es eine Vielzahl von Anwendungen, die eine schnelle Analyse von Genexpressionsprofilen in verschiedenen molekularen Subtypen von Brusttumoren und Zelllinien, das Screening auf mitausgedrückte Gene zur Erzeugung potenzieller Metagen und das Screening von Co-Expressen für die Entstehung potenzieller Metagen und die Analyse von Genexpressionsprofilen für die Entstehung potenzieller Metagen und die Analyse von Genexpressionsprofilen in verschiedenen molekularen Subtypen von Brusttumoren und Zelllinien, das Screening auf mitausgedrückte Gene zur Erzeugung potenzieller Metenen und die Bereitstellung von Korrelationsanalyse zwischen Ergebnis und Genexpression von einzelnen Genen, Gensätzen oder Gen-Signaturen in Brustkrebsdaten setzen sich auf 15.
Der Human Protein Atlas ist ein Open-Access-Programm, das für Wissenschaftler entwickelt wurde, um menschliche Proteome zu erforschen, die bereits zu einer Vielzahl von Publikationen auf dem Gebiet der menschlichen Biologie und Krankheit beigetragen haben. Der Human Protein Atlas ist als europäische Kernressource für Life-Science-Community 16,17anerkannt.
Der Kaplan Meier Plotter ist ein Online-Tool, das die Genexpression und klinische Daten gleichzeitig integriert und die prognostizistische Wirkung von 54.675 Genen auf der Grundlage von 10.461 KrebsProben, darunter 1.065 gastric, 2.437 Lunge, 1.816 Eierstöcke und 5.143, ermöglicht. Brustkrebspatientinnen mit einer mittleren Nachbeobachtung von 33/49/40/69 Monate18. Informationen zur Genexpression, zum rückfallfreien Überleben (RFS) und zum Gesamtüberleben (OS) sind aus dieser Datenbank19,20heruntergeladen.
Hier beschreiben wir ein praktisches Operationsverfahren, bei dem mehrere öffentlich zugängliche Datenbanken verwendet werden, um Veränderungsmuster in der Expression des Interesses über mehrere Krebsstudien hinweg zu vergleichen, zu analysieren und zu visualisieren, mit dem Ziel, die Expressionsprofile, prognostische Werte und mögliche biologische Funktionen bei Brustkrebs. So haben neuere Studien die onkogenen Eigenschaften von ID-Proteinen bei Tumoren aufgezeigt und waren mit bösartigen Merkmalen in Verbindung gebracht worden, darunter zelluläre Transformation, Verewigung, verstärkte Proliferation und Metastasen 21, 22,23. Allerdings spielt jedes Mitglied der ID-Familie unterschiedliche Rollen in verschiedenen Arten von soliden Tumoren, und ihre Rolle bei Brustkrebs bleibt unklar24. In früheren Studien, die mit dieser Methode untersucht wurden, stellten wir fest, dass ID1 ein aussagekräftiger prognostischer Indikator für Brustkrebs 25 war. Daher wird das Protokoll ID1 als Beispiel für die Einführung der Data-Mining-Methoden nehmen.
Die Analyse beginnt damit, das Ausdrucksmuster des Gens von Interesse an Krebsproben vs. normalen Proben in ONCOMINE zu hinterfragen. Dann wurde der Ausdruck Korrelation von Genen von Interesse an Brustkrebs mit dem bc-GenExMiner v4.0, GOBO und ONCOMINE durchgeführt. Als nächstes wurden die Expressionsprofile von ID1 nach verschiedenen Untergruppen mit den oben genannten drei Datenbanken geschichtet. Schließlich wurde der Zusammenhang zwischen ID1-Ausdruck und Überleben aus mit bc-GenExMiner v4.0, dem menschlichen Proteinatlas, und Kaplan-Meier-Plotter analysiert. Der Operationsvorgang wurde als Flussdiagramm in Abbildung1 gezeigt.
Eine umfassende Analyse öffentlicher Datenbanken kann die zugrunde liegende Funktion des Gens von Interesse aufzeigen und den möglichen Zusammenhang zwischen diesem Gen und klinikathologischen Parametern in bestimmten Krebsarten27,31aufzeigen. Die Erkundung und Analyse auf der Grundlage einer einzigen Datenbank könnte aufgrund der potenziellen Selektionsneigung oder in gewissem Maße, möglicherweise aufgrund der Vielfalt der Datenqualität, einschließlich de…
The authors have nothing to disclose.
Diese Arbeit wurde teilweise von der Natural Science Foundation der Provinz Guangdong, China (Nr. 2018A030313562), dem Lehrreformprojekt der Guangdong Clinical Teaching Base (NO. 2016JDB092), National Natural Science Foundation of China (81600358), und Youth Innovative Talent Project of Colleges and Universities in Guangdong Province, China (NO. 2017KQNCX073)
A personal computer or computing device with an Internet browser with Javascript enabled |
Microsoft | 051690762553 | We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above |
Adobe Flash player | Adobe Systems Inc. | It can be freely downloaded from http://get.adobe.com/flashplayer/. | This browser plug-in is required for visualizing networks on the network analysis tab. |
Chrome Broswer | Google Inc. | It can be freely downloaded from https://www.google.cn/chrome/ | This is necessary for viewing PDF files including the Pathology Reports and many of the downloadable files. |
Java Runtime Environment | Oracle Corporation | It can be downloaded from http://www.java.com/getjava/. | |
Office 365 ProPlus for Faculty | Microsoft | 2003BFFD8117EA68 | This is necessary for viewing the Pathology Reports and for viewing many of the downloadable files. |
Vectr Online | Vectr Labs Inc. | It can be freely used from https://vectr.com/new | This is necessary for visualizing and editing many of the downloadable files and pictures. |