כאן, אנו מציגים פרוטוקול כדי לחקור את הביטויים מנבא הישרדות של סרטן השד המבוסס על ניתוח מקיף של מאגרי נתונים קליניים במאגר נגזר ממגוון של מסדי נתונים נגישים בפומבי, באמצעות האסטרטגיה של ביטוי, קורלציה ו ניתוח הישרדות צעד אחר צעד.
בשנים האחרונות, מאגרי מידע המתעוררים נועדו להנמיך את המחסומים עבור מתקרבים מורכבות נתונים גנומית של הסרטן, ובכך, הקלה חוקרים לנתח ולפרש גנים, דגימות ונתונים קליניים על פני סוגים שונים של סרטן. בזאת, אנו מתארים הליך פעולה מעשית, לקיחת ID1 (מעכב של כריכת ה-DNA חלבונים 1) כדוגמה, כדי לאפיין את דפוסי הביטוי של ביואריקר והישרדות של סרטן השד המבוסס על ערכות נתונים קליניים במאגר נגזר מסדי נתונים נגישים באינטרנט, כולל ONCOMINE, bcGenExMiner ורה v 4.0 (סרטן השד ביטוי כורה v 4.0), GOBO (ביטוי גנטי תוצאה עבור סרטן השד באופן מקוון), HPA (אטלס החלבון האנושי), והתווין של קפלן מאייר. הניתוח החל בביצוע שאילתות על תבנית הביטוי של גן העניין (למשל, ID1) בדגימות סרטני לעומת דגימות רגילות. אז, ניתוח מתאם בין ID1 ו clinicopathological מאפיינים בסרטן השד בוצעה. לאחר מכן, פרופילי הביטויים של ID1 היתה מרובדת בהתאם לקבוצות שונות. לבסוף, הקשר בין ביטוי ID1 לתוצאת ההישרדות נותח. הליך הפעולה מפשט את הקונספט לשלב סוגי נתונים רב-ממדיים ברמת הגנים ממסדי נתונים שונים והשערות בדיקה בנוגע להישנות והקשר גנומית של אירועי שינוי גנים בסרטן השד. שיטה זו יכולה לשפר את האמינות ואת הייצוג של המסקנות, ובכך, להציג פרספקטיבה אינפורמטיבית על גן של עניין.
סרטן השד היא מחלה הטרוגנית עם פרוגנוזה מגוונת ואסטרטגיות טיפול בתתי-סוגים שונים, שבו הפתוגנזה והתפתחות קשורים כנראה עם מנגנונים מולקולריים שונים1,2 , 3. עם זאת, זיהוי מטרה טיפולית לוקח בדרך כלל שנים, או אפילו עשורים, מן התגלית הראשונית במחקר בסיסי לשימוש קליני4. הגנום ביישום רחב של טכנולוגיית רצף התפוקה גבוהה עבור הגנום סרטן יש מתקדם מאוד את תהליך החיפוש אחר סמנים יקרי ערך או מטרות טיפוליות 5.
כמות מוחצת של נתונים גנומיקה של סרטן שנוצרו מפלטפורמות גנומיקה של סרטן בקנה מידה גדול, כגון ICGC (הגנום הבינלאומי סרטן קונסורציום) ו TCGA (סרטן הגנום אטלס), הוא פוזות אתגר גדול עבור חוקרים לבצע נתונים חקר, אינטגרציה וניתוח, במיוחד עבור משתמשים חסרי הכשרה אינטנסיבית באינפורמטיקה וחישוביות6,7,8,9,10. בשנים האחרונות, מאגרי מידע המתעוררים, (למשל, oncomine, bcgenexminer ורה v 4.0, והתווין קפלן-מאייר, וכו ‘) תוכננו ופותחו כדי להוריד את הבר לקראת מורכבות מורכבים הגנוסטים של הסרטן, ובכך, הקלה חוקרים לנתח ו לפרש את הגנים, דגימות ונתונים קליניים על פני סוגים שונים של סרטן11. המטרה של פרוטוקול זה היא לתאר אסטרטגיית מחקר המשולבת עם רמות מרובות של מידע גנטי מסדרה של מסדי נתונים פתוחים לגישה, אשר הכירו באופן נרחב על ידי מספר רב של חוקרים, כדי לזהות את הסמנים הפוטנציאליים ו גורמי התחזיות לסרטן השד.
מסד הנתונים ONCOMINE הוא פלטפורמת כריית נתונים מבוססת-אינטרנט עם מידע microarray סרטן והוא נועד להקל על גילוי הסמנים החדשניים ומטרות טיפוליות11. כיום, יש יותר מ 48,000,000 ביטוי גנים מדידות מ 65 ביטוי גנים datasets במסד נתונים זה11,12. V 4.0 bcGenExMiner ורה (כלי חינם עבור מוסד ללא כוונת רווח), המכונה גם סרטן השד גן-ביטוי כורה, הוא יישום ידידותי למשתמש אינטרנט הכולל תוצאות מיקרו DNA של 3,414 התאושש סרטן השד מטופלים ו 1,209 מנוסה אירוע הגנאי13. הוא נועד לשפר את ביצועי ניתוח הגן התחזיות עם R תוכנה סטטיסטית וחבילות.
GOBO הוא רב תכליתי ידידותי למשתמש כלי מקוון עם מידע microarrays (למשל, Affymetrix U133A) מ 51-לדוגמה סרטן השד להגדיר קו הגדר ו 1881-לדוגמה מערכת הנתונים גידול בשד, המאפשר מגוון רחב של ניתוחים14. ישנם מגוון של יישומים זמינים במסד הנתונים GOBO, הכוללים ניתוח מהיר של פרופילי ביטוי גנים בסוגים מולקולריים שונים של גידולים בשד וקווי התא, הקרנה עבור שיתוף הגנים ליצירת מוטאים פוטנציאליים, ו ניתוח מתאם בין התוצאה לבין רמות ביטוי גנים של גנים בודדים, סטים של גנים, או חתימות גנים בערכת נתונים של סרטן השד15.
החלבון האנושי אטלס הוא תוכנית גישה פתוחה שנועדה מדענים לחקור פרוטדום אנושי, אשר תרם כבר מספר רב של פרסומים בתחום הביולוגיה האנושית ומחלות. אטלס החלבון האנושי מוכר כמשאב ליבה אירופאי לקהילת מדעי החיים16,17.
תווין קפלן מאייר הוא כלי מקוון המשלב ביטוי גנים נתונים קליניים בו זמנית המאפשר הערכה של השפעת התחזיות של 54,675 גנים מבוסס על 10,461 דגימות סרטן, אשר כוללים 1,065 קיבה, 2,437 ריאות, 1,816 השחלות 5,143 סרטן השד חולים עם מעקב מרושע של 33/49/40/69 חודשים18. מידע של ביטוי גנים, הישרדות ללא התדרדרות (rfs) והישרדות כוללת (OS) הם להורדה ממסד נתונים זה19,20.
כאן, אנו מתארים הליך פעולה מעשית של שימוש במסדי נתונים מרובים הנגישים לציבור כדי להשוות, לנתח ולהמחיש דפוסי שינויים בביטוי של הגן של עניין על פני לימודי סרטן מרובים, עם המטרה של הסיכום פרופילי ביטויים, ערכי תחזיות ופונקציות ביולוגיות פוטנציאליות בסרטן השד. לדוגמה, מחקרים שנעשו לאחרונה הצביעו על תכונות אונגניים של מזהה חלבונים בגידולים והיה קשור לתכונות ממאירות, כולל שינוי הסלולר, הממרה, התפשטות משופרת גרורות21, 22,23. עם זאת, כל חבר של משפחת מזהה משחק תפקידים ברורים סוגים שונים של גידולים מוצקים, ואת תפקידם בסרטן השד נשאר ברור24. במחקרים קודמים, בחנו דרך שיטה זו, מצאנו כי ID1 היה אינדיקטור התחזיות משמעותי בסרטן השד25. לכן, הפרוטוקול ייקח ID1 כדוגמה להציג את שיטות הכרייה נתונים.
הניתוח מתחיל מביצוע שאילתה על תבנית הביטוי של גן העניין בדגימות סרטני לעומת דגימות רגילות ב-ONCOMINE. לאחר מכן, מתאם הביטוי של גנים של עניין בסרטן השד בוצע באמצעות bc-GenExMiner ורה v 4.0, GOBO, ו ONCOMINE. לאחר מכן, פרופילי הביטויים של ID1 התבצעה בהתאם לקבוצות שונות באמצעות שלושה מסדי הנתונים שלעיל. לבסוף, הקשר בין ID1 ביטוי להישרדות החוצה נותח באמצעות bc-GenExMiner ורה v 4.0, אטלס החלבון האנושי, ותווין קפלן-מאייר. פרוצדורת הפעולה הוצגה כתרשים הזרימה באיור 1.
ניתוח מקיף של מסדי נתונים ציבוריים עשוי להצביע על הפונקציה הבסיסית של הגן של עניין ולחשוף את הקשר הפוטנציאלי בין הגן הזה ואת הפרמטרים clinicopathological בסרטן ספציפי27,31. החקירה והניתוח המבוסס על מסד נתונים אחד עשוי לספק פרספקטיבות מוגבלות או מבודדות עקב הטיית הבחי…
The authors have nothing to disclose.
עבודה זו היתה נתמכת בחלקו על ידי הקרן המדע הטבעי של מחוז גואנג-דונג, סין (No. 2018A030313562), הרפורמה בפרויקט לרפורמות של גואנג-דונג בסיס להוראה קלינית (NO. 2016JDB092), הקרן הלאומית למדע הטבע של סין (81600358), והנוער כישרון חדשני פרויקט של מכללות ואוניברסיטאות בפרובינצית גואנג-דונג, סין (NO 2017KQNCX073)
A personal computer or computing device with an Internet browser with Javascript enabled |
Microsoft | 051690762553 | We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above |
Adobe Flash player | Adobe Systems Inc. | It can be freely downloaded from http://get.adobe.com/flashplayer/. | This browser plug-in is required for visualizing networks on the network analysis tab. |
Chrome Broswer | Google Inc. | It can be freely downloaded from https://www.google.cn/chrome/ | This is necessary for viewing PDF files including the Pathology Reports and many of the downloadable files. |
Java Runtime Environment | Oracle Corporation | It can be downloaded from http://www.java.com/getjava/. | |
Office 365 ProPlus for Faculty | Microsoft | 2003BFFD8117EA68 | This is necessary for viewing the Pathology Reports and for viewing many of the downloadable files. |
Vectr Online | Vectr Labs Inc. | It can be freely used from https://vectr.com/new | This is necessary for visualizing and editing many of the downloadable files and pictures. |