המחקר הנוכחי השתמש ב-U-Net ובאלגוריתמים אחרים של למידה עמוקה כדי לפלח תמונת לשון והשווה את תוצאות הסגמנטציה כדי לחקור את החפצת אבחון הלשון.
אבחון לשון הוא טכניקה חיונית של אבחון הרפואה הסינית המסורתית (TCM), והצורך בהחפצת תמונות לשון באמצעות טכנולוגיית עיבוד תמונה הולך וגדל. המחקר הנוכחי מספק סקירה כללית של ההתקדמות שחלה בהחפצת לשון בעשור האחרון ומשווה מודלים של סגמנטציה. מודלים שונים של למידה עמוקה נבנים כדי לאמת ולהשוות אלגוריתמים באמצעות ערכות תמונות לשון אמיתיות. נקודות החוזק והחולשה של כל מודל מנותחות. הממצאים מצביעים על כך שהאלגוריתם של U-Net עולה בביצועיו על מודלים אחרים הנוגעים למדדי דיוק דיוק (PA), היזכרות וממוצע הצטלבות על פני איחוד (MIoU). עם זאת, למרות ההתקדמות המשמעותית ברכישה ובעיבוד של תמונות לשון, טרם נקבע סטנדרט אחיד לאבחון החפצת לשון. כדי להקל על היישום הנרחב של תמונות לשון שצולמו באמצעות מכשירים ניידים בהחפצה של אבחון לשון, מחקר נוסף יכול להתמודד עם האתגרים שמציבות תמונות לשון שצולמו בסביבות מורכבות.
תצפית לשון היא טכניקה נפוצה ברפואה האתנית הסינית המסורתית (TCM). הצבע והצורה של הלשון יכולים לשקף את המצב הגופני ואת תכונות המחלה, חומרותיה ופרוגנוזות שונות. לדוגמה, ברפואת המונג המסורתית, צבע הלשון משמש לזיהוי טמפרטורת הגוף, למשל, לשון אדומה או סגולה מצביעה על גורמים פתולוגיים הקשורים לחום. ברפואה הטיבטית, מצב נשפט על ידי התבוננות בלשון של מטופל, תוך שימת לב לצבע, לצורה וללחות של הריר. לדוגמה, הלשונות של חולים עם מחלת היי הופכות אדומות ומחוספסות או שחורות ויבשות1; חולים עם מחלת Xieri2 יש לשון צהובה ויבשה; בינתיים, לחולים עם מחלת בדקאן3 יש לשון לבנה, לחה ורכה4. תצפיות אלה חושפות את הקשר ההדוק בין תווי הלשון לבין פיזיולוגיה ופתולוגיה. באופן כללי, מצב הלשון ממלא תפקיד חיוני באבחון, זיהוי מחלות והערכת השפעת הטיפול.
במקביל, בשל תנאי חיים מגוונים ומנהגי תזונה בין קבוצות אתניות שונות, ניכרים הבדלים בדימויי הלשון. מודל המעבדה, שנקבע על בסיס תקן בינלאומי לקביעת צבע, גובש על ידי הוועדה הבינלאומית לאקלראז’ (CIE) בשנת 1931. בשנת 1976 שונתה תבנית צבע וקיבלה את שמה. מודל הצבע Lab מורכב משלושה אלמנטים: L מתאים לבהירות, בעוד a ו-b הם שני ערוצי צבע. A כולל צבעים מירוק כהה (ערך בהירות נמוכה) דרך אפור (ערך בהירות בינונית) עד ורוד בהיר (ערך בהירות גבוהה); B עובר מכחול בהיר (ערך בהירות נמוכה) לאפור (ערך בהירות בינונית) לצהוב (ערך בהירות גבוהה). על ידי השוואת ערכי L x a x b של צבע הלשון של חמש קבוצות אתניות, יאנג ואחרים מצאו כי המאפיינים של תמונות לשון של קבוצות המונג, חוי, ג’ואנג, האן ומונגוליה היו שונים באופן משמעותי זה מזה. לדוגמה, למונגולים יש לשונות כהות עם ציפוי לשון צהוב, בעוד שלבני המונג יש לשון בהירה עם ציפוי לשון לבן, דבר המצביע על כך שתווי הלשון יכולים לשמש כאינדיקטור אבחוני להערכת מצב הבריאות של אוכלוסייה. יתר על כן, תמונות לשון יכולות לתפקד כמדד הערכה לרפואה מבוססת ראיות במחקר קליני של רפואה אתנית. הוא ועמיתיו השתמשו בתמונות לשון כבסיס לאבחון TCM והעריכו באופן שיטתי את הבטיחות והיעילות של כדורי Chou-Ling-Dan (גרגרי CLD המשמשים לטיפול במחלות דלקתיות וחום, כולל שפעת עונתית ב- TCM) בשילוב עם רפואה סינית ומערבית. התוצאות ביססו את התוקף המדעי של תמונות לשון כמדד הערכה למחקרים קליניים. עם זאת, רופאים מסורתיים מסתמכים בדרך כלל על סובייקטיביות כדי לבחון את מאפייני הלשון ולהעריך את מצבם הפיזיולוגי והפתולוגי של החולים, הדורשים אינדיקטורים מדויקים יותר.
הופעתם של האינטרנט וטכנולוגיית הבינה המלאכותית סללה את הדרך לדיגיטציה והחפצה של אבחון לשון. תהליך זה כרוך בשימוש במודלים מתמטיים כדי לספק תיאור איכותי ואובייקטיבי של תמונות לשון7, המשקף את התוכן של תמונת הלשון. התהליך כולל מספר שלבים: רכישת תמונה, פיצוי אופטי, תיקון צבע וטרנספורמציה גיאומטרית. התמונות המעובדות מראש מוזנות לאחר מכן למודל אלגוריתמי למיקום וסגמנטציה של תמונות, חילוץ תכונות, זיהוי תבניות וכו ‘. תוצר תהליך זה הוא אבחון יעיל ומדויק ביותר של נתוני תמונת לשון, ובכך משיג את המטרה של החפצה, כימות ואינפורמציה של אבחון לשון8. כך מושגת המטרה של יעילות גבוהה ועיבוד מדויק של נתוני אבחון הלשון. בהתבסס על ידע באבחון לשון וטכנולוגיית למידה עמוקה, מחקר זה הפריד באופן אוטומטי את גוף הלשון ואת ציפוי הלשון מתמונות לשון באמצעות אלגוריתם ממוחשב, על מנת לחלץ את התכונות הכמותיות של הלשון עבור רופאים, לשפר את האמינות והעקביות של האבחון, ולספק שיטות למחקר החפצה של אבחון לשון לאחר מכן9.
בהתבסס על תוצאות ההשוואה שהוצגו לעיל, ניכר כי המאפיינים של ארבעת האלגוריתמים הנדונים מגוונים, והיתרונות והחסרונות המובהקים שלהם מתוארים להלן. מבנה U-Net, המבוסס על שינוי והרחבה של רשת קונבולוציה מלאה, יכול לקבל מידע קונטקסטואלי ומיקום מדויק באמצעות נתיב התקשרות ונתיב התרחבות סימטרי. על ידי…
The authors have nothing to disclose.
עבודה זו נתמכה על ידי הקרן הלאומית לטבע של סין (מענק מס’ 82004504), התוכנית הלאומית למחקר ופיתוח מפתח של משרד המדע והטכנולוגיה של סין (מענק מס’ 2018YFC1707606), מינהל הרפואה הסינית של מחוז סצ’ואן (מענק מס’ 2021MS199) וקרן הטבע הלאומית של סין (מענק מס’ 82174236).
CPU | Intel(R) Core(TM) i7-9700K | ||
GPU | NVIDIA GeForce RTX 3070 Ti (8192MB) | ||
Operating systems | Microsoft Windows 10 Professional Edition (64-bit) | ||
Programming language | Python | ||
RAM | 16G |