Hier presenteren we een protocol om de biomarker en Survival voorspeller van borstkanker te verkennen op basis van de uitgebreide analyse van gebundelde klinische datasets afgeleid van een verscheidenheid van openbaar toegankelijke databases, met behulp van de strategie van meningsuiting, correlatie en overlevings analyse stap voor stap.
In de afgelopen jaren, opkomende databases werden ontworpen om de belemmeringen voor het benaderen van de ingewikkelde kanker genomic datasets, waardoor het vergemakkelijken van onderzoekers te analyseren en te interpreteren genen, monsters en klinische gegevens over verschillende vormen van kanker te verlagen. Hierin beschrijven we een praktische operatieprocedure, waarbij ID1 (remmer van DNA-bindende eiwitten 1) als een voorbeeld, om de expressie patronen van biomarker en overleving voorspellers van borstkanker te karakteriseren op basis van gebundelde klinische datasets afgeleid van Online toegankelijke databases, waaronder ONCOMINE, bcGenExMiner v 4.0 (borstkanker gen-Expression Miner v 4.0), GOBO (genexpressie-based uitkomst voor borstkanker online), HPA (de menselijke proteïne Atlas), en Kaplan-Meier plotter. De analyse begon met het bevragen van het uitdrukkingspatroon van het gen van belang (b.v., ID1) in kanker monsters versus normale steekproeven. Vervolgens werd de correlatieanalyse tussen ID1 en clinicopathological kenmerken bij borstkanker uitgevoerd. Vervolgens werd de expressieprofielen van ID1 gelaagd volgens verschillende subgroepen. Tot slot werd de associatie tussen ID1 expressie en overlevings uitkomst geanalyseerd. De operatieprocedure vereenvoudigt het concept om multidimensionale data types te integreren op het gen niveau van verschillende databases en test hypothesen met betrekking tot herhaling en genomische context van gen wijziging gebeurtenissen in borstkanker. Deze methode kan de geloofwaardigheid en de representativiteit van de conclusies verbeteren, daardoor, huidig informatief perspectief op een gen van belang.
Borstkanker is een heterogene ziekte met diverse prognose-en behandelingsstrategieën in verschillende moleculaire subtypen, waarbij de pathogenese en de ontwikkeling waarschijnlijk geassocieerd worden met uiteenlopende moleculaire mechanismen1,2 , 3. echter, het identificeren van een therapeutisch doelwit duurt meestal jaren, of zelfs decennia, van de eerste ontdekking in fundamenteel onderzoek naar klinisch gebruik4. Genoom brede toepassing van high-throughput sequencing technologie voor kanker genoom is sterk gevorderd het proces van het zoeken naar waardevolle Biomarkers of therapeutische doelstellingen 5.
De overweldigende hoeveelheid kanker Genomics gegevens die door de grootschalige kanker Genomics platforms, zoals de ICGC (International Cancer genoom Consortium) en TCGA (de Cancer genoom Atlas), is een grote uitdaging voor onderzoekers om gegevens uit te voeren exploratie, integratie en Analytics, met name voor gebruikers die geen intensieve opleiding in informatica en berekening6,7,8,9,10. In de afgelopen jaren, opkomende databases, (bijv., ONCOMINE, bcGenExMiner v 4.0, en Kaplan-Meier plotter, enz.) werden ontworpen en ontwikkeld om de bar te verlagen voor het naderen van de ingewikkelde kanker genomic datasets, waardoor het vergemakkelijken van onderzoekers te analyseren en interpreteren van de genen, monsters en klinische gegevens over verschillende vormen van kanker11. Het doel van dit protocol is een onderzoekstrategie te beschrijven die is geïntegreerd met meerdere niveaus van gen-informatie uit een reeks Open Access-databases, die op grote schaal door een groot aantal onderzoekers zijn erkend, om de potentiële biomerkers te identificeren en prognostische factoren voor borstkanker.
De ONCOMINE database is een web-gebaseerde data-mining platform met kanker Microarray informatie en is ontworpen om de ontdekking van nieuwe biomarkers en therapeutische doelstellingen te vergemakkelijken11. Momenteel zijn er meer dan 48.000.000 genexpressie metingen van 65 genexpressie datasets in deze database11,12. De bcGenExMiner v 4.0 (een gratis tool voor non-profit instelling), ook wel borstkanker Gene-Expression Miner, is een gebruiksvriendelijke web-based applicatie bestaande uit DNA arrays resultaten van 3.414 teruggewonnen borstkanker patiënten en 1.209 ervaren een pejoratieve gebeurtenis13. Het is ontworpen om gen prognostische analyse prestaties te verbeteren met R statistische software en pakketten.
De GOBO is een multifunctioneel gebruiksvriendelijk online tool met arrays informatie (bijv. Affymetrix U133A) van een 51-sample borstkanker Cell line set en een 1881-sample borsttumor data set, dat een breed scala van analyses maakt14. Er zijn een verscheidenheid van toepassingen beschikbaar in de GOBO database, die een snelle analyse van genexpressie profielen in verschillende moleculaire subtypen van borsttumoren en cel lijnen, screening voor co-uitgesproken genen voor de schepping van potentiële gen te nemen, en correlatieanalyse tussen resultaat en genexpressie niveaus van enkelvoudige genen, sets van genen, of gen handtekeningen in de gegevens van borstkanker set15.
De menselijke eiwit Atlas is een Open-Access programma dat is ontworpen voor wetenschappers om de menselijke proteome, die al heeft bijgedragen aan een groot aantal publicaties op het gebied van de menselijke biologie en ziekte te verkennen. De menselijke eiwit Atlas wordt erkend als een Europese kern bron voor Life Science Gemeenschap16,17.
De Kaplan Meier plotter is een online hulpmiddel dat genexpressie en klinische gegevens gelijktijdig integreert dat beoordeling van het prognostische effect van 54.675 genen toestaat die op 10.461 kanker steekproeven worden gebaseerd, die 1.065 maag, 2.437 Long, 1.816 ovariële en 5.143 omvatten borstkanker patiënten met een gemiddelde follow-up van 33/49/40/69 maanden18. Informatie van genexpressie, terugval-vrije overleving (RFS) en algehele overleving (OS) zijn te downloaden van deze database19,20.
Hier beschrijven we een praktische operatieprocedure van het gebruik van meerdere openbaar toegankelijke databases te vergelijken, te analyseren en te visualiseren patronen van veranderingen in de expressie van het gen van belang in meerdere kanker studies, met als doel het samenvatten van de expressieprofielen, prognostische waarden en potentiële biologische functies bij borstkanker. Bijvoorbeeld, recente studies hebben aangegeven de oncogene eigenschappen van ID-eiwitten in tumoren en werden geassocieerd met kwaadaardige functies, waaronder cellulaire transformatie, immortalisatie, Enhanced proliferatie en metastase21, 22,23. Nochtans, speelt elk lid van de familie van identiteitskaart verschillende rollen in verschillende types van stevige tumors, en hun rol in borstkanker blijft onduidelijk24. In eerdere studies, onderzocht door middel van deze methode, vonden we dat ID1 was een zinvolle prognostische indicator in borstkanker25. Daarom zal het protocol ID1 als voorbeeld nemen om de data mining methoden in te voeren.
De analyse begint van het bevragen van het uitdrukkingspatroon van het gen van belang in kanker monsters versus normale steekproeven in ONCOMINE. Vervolgens werd de uitdrukking correlatie van de genen van belang in borstkanker werd uitgevoerd met behulp van de BC-GenExMiner v 4.0, GOBO, en ONCOMINE. Vervolgens werd de expressieprofielen van ID1 gelaagd volgens verschillende subgroepen met behulp van de drie bovengenoemde databases. Ten slotte werd de associatie tussen ID1 expressie en Survival out geanalyseerd met BC-GenExMiner v 4.0, de menselijke proteïne Atlas, en de Kaplan-Meier plotter. De bewerkingsprocedure werd weergegeven als het stroomdiagram in Figuur 1.
Uitgebreide analyse van openbare databases kan wijzen op de onderliggende functie van het gen van belang en onthullen het potentiële verband tussen dit gen en clinicopathological parameters in specifieke kanker27,31. De exploratie en analyse op basis van een enkele database kan bieden beperkte of geïsoleerde perspectieven als gevolg van de potentiële selectie bias, of in zekere mate, mogelijk te wijten aan de verscheidenheid van de kwaliteit van gegevens, met …
The authors have nothing to disclose.
Dit werk werd gedeeltelijk gesteund door de Stichting van de natuurwetenschappen van de provincie van Guangdong, China (nr. 2018A030313562), het onderwijs hervormings project van het klinische onderwijs van Guangdong basis (nr. 2016JDB092), National Natural Science Foundation van China (81600358), en de jeugd innovatieve talent project van hogescholen en universiteiten in de provincie Guangdong, China (NO. 2017KQNCX073)
A personal computer or computing device with an Internet browser with Javascript enabled |
Microsoft | 051690762553 | We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above |
Adobe Flash player | Adobe Systems Inc. | It can be freely downloaded from http://get.adobe.com/flashplayer/. | This browser plug-in is required for visualizing networks on the network analysis tab. |
Chrome Broswer | Google Inc. | It can be freely downloaded from https://www.google.cn/chrome/ | This is necessary for viewing PDF files including the Pathology Reports and many of the downloadable files. |
Java Runtime Environment | Oracle Corporation | It can be downloaded from http://www.java.com/getjava/. | |
Office 365 ProPlus for Faculty | Microsoft | 2003BFFD8117EA68 | This is necessary for viewing the Pathology Reports and for viewing many of the downloadable files. |
Vectr Online | Vectr Labs Inc. | It can be freely used from https://vectr.com/new | This is necessary for visualizing and editing many of the downloadable files and pictures. |