2008 年民生電子研討會
類神經於醫療資訊系統之應用 江昭龍 1
t129@nkut.edu.tw
陳俊良 2 陳泇佑 3 1, 2 南開科技大學 電子系 3 南開科技大學 電機與資訊研究所 junchen@nkut.edu.tw julyjune71@yahoo.com.tw
摘要 本研究主要為類神經於醫療資訊系統之應用, 先 收 集 了 大 量 的 健 檢 資 料 (340 人 份 的 健 康 檢 查 表),加以分類及整理後,利用類神經程式進行訓練 與測試,可有效找出醫療檢驗項目與人體疾病的關 聯性,本文的類神經模式經過三個類神經結構的比 較分析後,驗證得到本文的類神經模式設計確具有 很高得準確度。最後利用網路架設程式建構醫療資 訊網站,將類神經分析出的醫療檢驗項目與人體疾 病之關聯模式提供大眾使用。本文的「醫療資訊建 置與管理系統」,同時可協助醫生作更準確有效的 專業疾病診斷之輔助及降低醫師的工作負擔,非常 具有實用性及使用方便性。 關鍵詞:醫療資訊、分析系統、類神經。
1. 前言 目前國內許多醫院(醫療檢驗所)其生理檢驗 資訊及檢驗報告並未電子化。這些資訊大多以紙本 方式散佈於患者病歷中,因此有些檢驗資訊便在檢 驗後即告流失,這種情形不但造成原(舊)有病歷 不易交換及運用,且醫學研究者也喪失了許多可供 研究之寶貴資源。如果能將此檢驗資訊轉换成一般 人都可以容易了解此結果與個人的生理疾病關係 的話,除了可以快速提供受檢驗者清楚的檢驗結果 外,並可方便醫護人員對檢驗者的說明,更可以作 為協助醫師專業疾病診斷的參考輔助。 本研究「醫療資訊系統」 ,運用所收集的大量健 檢資料,並加以分析問題發生的因果,試圖找出關 聯性,設計類神經網路,建構醫療資訊網站提供大 眾使用及協助醫生做診斷輔助。本文採用人工智慧 理論中非常具有實際成效的「類神經網路」[1~ 8] 來建立類神經醫療資訊模型,「類神經網路」之所 能在短短的十年間,成為一個廣受重視及投入的研 究,主要原因是具有許多優異的特性: (1) 具有平 行及分離處理能力;(2) 容錯能力相當高;(3) 可經 由實例學習的方式建構系統,解決許多複雜困難問 題。因此以往很多需經長期人工作業以及大量資料 分析方能解決的問題,現在均可利用神經網路,在 很短時間內便可獲得解決方案。 因為本文所考慮的18種檢驗細項已涵蓋多數 醫療資訊內容,若能先利用大量醫療檢驗數據來建
立資料庫,再應用「類神經網路」來建構出一個醫 療資訊分析系統,則任何不具醫學專業背景的人士 都將能很詳細地了解檢驗的結果,及可簡易地利用 本文所建立的系統來得到分析結果。因此,本研究 將可對現行醫療檢驗資訊作出統合運用及判斷,使 醫療檢驗的效果發揮出更大的效益。
2. 類神經網路分析 類神經網路[1](Neural network, NN)已經被 廣泛的應用於工業界。類神經網路經常運用在作為 系統鑑別分級的判斷工具,或當作建立非線性系統 模式的方法,在有限的輸入和輸出狀況下,以類神 經網路來建立系統模式。類神經網路的學習能力很 強,但這也是類神經網路的缺點之一,因為一個傳 統的類神經網路內含有很多數目的參數(加權值與 偏 壓 值 ), 而 也 因 此 有 可 能 導 致 學 習 過 當 (Over-Fitting)的情況發生,亦將雜訊也學習進去 了。大多數的應用均使用前饋式倒傳遞的類神經網 路模式[2, 9, 10],倒傳遞的計算法則在類神經網路 的訓練方式中,是屬於監督式的訓練方法 (Supervised Training),訓練時提供網路多組明確 的輸入、輸出資料,亦即所謂訓練樣本,然後經由 二者間的關係來求得最佳的加權值與偏壓值,然 而,使用前饋式倒傳遞的類神經網路模式,必須花 費相當多的運算,而且這種方法可能降低了類神經 網路的準確度。因此如何求得準確的類神經網路的 加權值及偏壓值,並不是一件容易的事情。
3. 醫療檢驗資訊與疾病的關係 在各種醫療檢驗項目[11~ 12]中,較重要的檢驗 項目大致有五大類別(尿液檢查、血液檢查、腎功 能檢查、血脂肪檢查、肝膽功能檢查),其中共包 含有 18 種檢驗細項分別為:(1)酸鹼度、(2)尿 蛋白、 (3)紅血球數(4)血紅素(Hb)、 (5)血球容 積(HCT)、 (6)白血球數、 (7)血細胞比容(MCV)、 (8)血紅蛋白量(MCH)、 (9)平均紅血球血紅素濃 度(MCHC)、 (10)血小板、 (11)血清肌酸酐(CRE)、 (12)尿酸、(13)總膽固醇、(14)HDL、(15) LDL 膽固醇、(16)中性脂肪(三酸甘油脂)、(17) SGOT、 (18)SGPT。上述的 18 種檢驗細項內容及 其醫療上的意義簡述如下: (一)、尿液檢查
- 17 -
2008 Workshop on Consumer Electronics
2008 年民生電子研討會
1.酸鹼度 正常人在進食普通膳食的條件下,尿液的 pH 值為五點零~七點零。尿液中的 pH 主要取決於尿 中磷酸二氫鈉和磷酸氫二鈉的含量。酸性尿見於 正常新鮮尿、糖尿病、酸中毒、低鉀性鹼中毒以 及應用酸性藥物等,鹼性尿見於尿中混入大量膿 汁、血液,常見於膀胱炎、腎盂腎炎時細菌分解 尿素、輸血後以及嚴重嘔吐等。 2.尿蛋白 尿蛋白的檢測正常值為(一) 。尿液檢查是以 蛋白、糖、潛血及沈渣為代表。此外,例如尿色、 氣味、量、比重、問值等的情報,也能夠加以掌 握。但是,尿的外觀並不是了解疾病的線索。最 近,檢查方向則朝β-2 微球蛋白及微白蛋白、 NAG 等微量蛋白及微量酵素的檢查。 腎臟本身有毛病時,蛋白就會出現在尿中。 從有無蛋白,就可以了解腎功能。這就是所謂的 「尿蛋白檢查」 。但是,最近除了定性檢查之外, 例如微量的白蛋白--微白蛋白--的測定,可以算是 一種定量的檢查。因此,用普通的檢查方式發現 尿蛋白為(一),但也可能出現微白蛋白。微白蛋 白的正常範圍為二十 mg/l。超出這個數值,利用 普通的定性檢查也能發現異常狀態。這是因為腎 臟的內皮細胞--在血管或毛細管內側好像磁磚般 貼著的細胞--略為遭到破壞時,會一點點、一點 點地漏出。這時就可以檢查出來,微白蛋白是了 解腎臟血管或毛細管內細胞狀態的指標。 例如罹患糖尿病時接受定性檢查,蛋白為(一) 腎臟狀態不錯,但是計算微白蛋白時,發現比普 通的數值更高。平常約為零或ㄧ~二的數值,上昇 到一百以上。藉此就可以知道可能是受到糖尿病 或高血壓的影響,腎臟的毛細血管已經開始受損 了。也就是說,血壓昇高時,腎臟的細小動脈引 起動脈硬化而造成的影響。同時,腎臟為了增加 因為動脈硬化而減少的腎血液循環量,大量產生 一些物質,形成了惡性循環,使得血壓更為上昇。 經由這些檢查,就可以清楚地了解到因為糖尿病 產生蛋白,或因為高血壓產生蛋白,使得全身毛 細孔血管受損。 與微白蛋白同樣的指標就是β-2 微球蛋白。 腎臟的過濾裝置腎小球過濾的β-2 微球蛋白,由 將尿成分再吸收,追加分泌的尿細管再吸收。但 是當尿細管出現毛病時,這個物質在尿中會微量 增加。而且,當腎臟輕微受損或癌症初期,會出 現這些物質。因此,尿蛋白的檢查能夠逐漸朝向 這種微量蛋白的定量檢查的方向前進。雖然不是 蛋白質,但存在於尿細管中的 NAG 酵素會因為 尿細管的一些變化而出現在尿中。同樣地,可以 當成腎臟病變的早期指標之一。 腎臟一旦惡化,如果沒有良藥使其功能復 甦,後果不堪設想。因為高血壓、糖尿病等長期 的影響,腎臟形成無法發揮作用的狀態則要謀求 對策就不容易了。光是降血壓,反而會減少腎臟
的血液流量。限制食鹽、蛋白質、水分等的食物 療法才是因應之道。 腎臟障礙的原因多半來自高血壓與糖尿病。 此外,糖尿病中的 SLE 也是會使腎臟血管受損的 疾病。另外,像腎結石,始終沒有治癒,多次出 現腎盂炎所引起的腎臟障礙等則是二次原因。孩 提時代罹患扁桃腺炎,後來雖然喉嚨治癒,但一 直產生蛋白,雖然是孩子,但是血壓很高,尿中 出現蛋白或糖,這都是由於腎炎所造成。 (二)、血液檢查 3.紅血球數 正常值:男性約四百萬~四百五十萬個/mm、 女性約三百五十萬~四百萬個/mm。 血液大致可分為紅血球、白血球、血小板等 有形成分以及其他液體成分--血漿。其中佔有形 成分大部分的紅血球是直徑七點五微米、厚二微 米,中央凹陷的圓盤型血球,在骨髓製造出來, 負責吸收氧及將氧運送至全身的任務。 要了解紅血球的正常、異常或是貧血,首先 應先調查紅血球的數目及紅血球中含鐵蛋白--也 就是血紅蛋白的量,還有血球成分在血液中所占 的比例--血細胞比容。首先是紅血球數,男女不 同。男性約有四百萬~四百五十萬個/mm;女性較 少,約三百五十萬~四百萬個/mm。男女若都低於 這個範圈,表示有貧血傾向。 相反,若超過七百萬個/mm。大多是上半身 肥胖型或高血壓的人容易出現的現象。而多血症 就是血沈一 mm/h 或是血細胞比容在百分之五十 以上的狀態,也就是血液非常粘的狀態。因此血 液容易阻塞,是引起血栓症的危險因子。 4.血紅素(Hb) 血紅素是存在於紅血球之中,一般來說,男 性的正常值是在十四至十八之間(即每一百西西 血液中,有十四至十八公克的血紅素) ,女性則是 十二至十六之間。一旦血紅素低於十,皆屬嚴重 貧血,主要是用於檢查是否貧血。高值時可能為 紅血球增多症,心輸出量減少;低值可能為低血 色素性貧血、或缺鐵性貧血。 5.血球容積(HCT) 血球容積是指紅血球在血液中所佔的體積比 例,是一個良好的貧血指標。男性的正常值為百 分之三十八至五十二之間,女性則為百分之三十 五至四十七。如果數值過高,則可能疾病是多血 症或脫水,過低則為貧血。 6.白血球數 正常值:六千~七千個/mm。在有形成分中, 白血球是在骨髓及淋巴組織中製造,負責保護我 們的身體,抵抗細菌等外敵的侵入。這個數目以 六千~七千個/mm 為正常範圍。若突然增高,表 示身體正受到外敵侵入,身體某處有發炎狀態。 發炎狀態是指如扁桃腺炎、肺炎或膽結石、腎結 石引起細菌感染時的狀態。有些人沒有任何自覺 症狀,能過普通生活,白血球數約九千個/mm。
- 18 -
2008 Workshop on Consumer Electronics
2008 年民生電子研討會
這些人大都是老煙槍,經常咳嗽,可能罹患慢性 支氣管炎或齒槽膿漏的毛病。除此之外,幾乎都 還會有發燒、疼痛等症狀。 白血球增加的原因當中,最可怕的就是白血 病。這時白血球數可達一萬個/mm 以上,有時甚 至增加到數十萬個/mm。這是因為生產白血球的 骨髓和淋巴組織致癌,使得白血球無法發揮原來 的效用,反而阻礙其他正常成分的功能。如此一 來,患者便容易引起感染一點點小毛病就會立刻 出血,最後導致死亡,是非常可怕的疾病。相反, 有些人再怎麼檢查,其白血球數都只有三千個 /mm 左右。檢查結果,若醫生診斷的是「白血球 減少症」而非常擔心,即使靠治療或生活上的努 力也無法增加。不過,這種現象本身並不會危及 生命,不必太擔心,只要觀察經過即可。但若不 是停止在三千個/mm,而是持續減少到一千個 /mm 左右,表示已失去免疫的抵抗力,是不得了 的疾病了,可能是某種感染病或是風濕、藥物(抗 生素、鎮痛劑等)的副作用。在這種情況下,若以 前就會有發燒等症狀出現,就已經不是定期檢診 的範圍之內了。 然而,我們所說的白血球,事實上有幾種。 也就是說,有複數核的多核白血球和只有一個核 的小淋巴球、具大核的單球,或是遇到色素會變 酸性的嗜酸性白細胞,被染成鹼性的嗜鹼性白細 胞等。發炎時多核白血球會增加,過敏時嗜酸性 白細胞會增加等,各自都可成為獨自的指標。 藉著了解這些白血球百分比,就可進行更詳細 的診斷。因此,最近有些設施也會進行這些檢查。 而各自所占的百分比,正常時,多核白血球約占 全體的百分之六十% ,淋巴球約百分之三十%, 嗜酸性白細胞、嗜鹼性白細胞約各佔五~三%。 7.血細胞比容(MCV) 正常值: 五十~三十五%。這是指血球成分在 血液全體中所占比例的數值,以五十~三十五% 為正常值。若低於正常值視為貧血。但是老人的 下限應稍低些。 血細胞比容是指紅血球、白血球、血小板三 種血球成分在血液中所占的比例,而紅血球和其 他成分相比,所占比例較多,所以只要考慮紅血 球在血液中所占的量即可。把這個數值加以計 算,就可以算出一個紅血球的體積(MCV) 而其 (MCV)的正常值為八十~九十一/f1 藉此就可確 認因貧血而縮小的紅血球狀態。 8.血紅蛋白量(MCH) 正常值:男性十八~十三 g/dl、女性十六~十 二 g/dl。血紅蛋白是紅血球中的含鐵蛋白質。這 個成分直接在肺與氧結合,利用血管運送到全 身,同時將不需要的二氧化碳帶回。血紅蛋白負 責如此重要的任務,若量減少,就會出現貧血狀 態,引起缺氧、呼吸困難、頭昏眼花及脫力感。 若未滿十二 g,表示稍低有貧血傾向。不過老年 人的骨髓會慢慢變成脂肪或纖維組織,導致造血
機能低下,平均值大約為十二 g/dl,所以正常範 圍也會隨之下降若干。 同樣是關於貧血的檢查,紅血球數會因為一 些條件而容易產生變動。血紅蛋白量則比較安 定,能得到正確的數值,故可信賴度更高。這裡 所列舉的數值是所有血液所產生的血紅蛋白量。 依計算方式不同,也可以算出一個紅血球的血紅 蛋白量(MCH)。而其(MCH)的正常值為 二十 七~三十一/pg,先前已經說明過血紅蛋白量會隨 著年齡增加而逐漸減少,出現貧血傾向。年輕人 若因愛美而限制飲食或生理不順,或是胃潰瘍、 十二指腸潰瘍、痔瘡等引起出血,形成失血狀態, 血紅蛋白量也會突然減少。這時下限值以十二 g/dl 為大致的標準。 9.平均紅血球血紅素濃度(MCHC) 在於測血紅素中血紅素濃度之平均值,以加 強對血紅素檢驗值之佐證。除了遺傳性圓形血球 症外,MCHC 不應大於 36;MCHC 降低則見於 缺鐵性貧血和地中海型貧血。 10.血小板 正常值:二十萬個/mm。血小板在有形成分中 是最小的,大小約二~四微米,擔任血液凝固及止 血的任務。男女都以二十萬個/mm 為正常值,但 有的人天生就只有十萬個/mm。若再低於這個數 值,表示出現血小板抗體或是血小板先天性異 常,有可能是疾病。但血液凝固顯著遲緩的病「血 友病」則是因血液凝固因子有缺損所造成,與血 小板沒有直接關係。 (三)、腎功能檢查 11.血清肌酸酐(CRE) 血清肌酸酐是肌肉運動的主要能源--肌酸所 分解的一種物質,可自由地通過腎臟的絲球體。 只要腎臟功能正常,血清肌酸酐會經由尿液排泄 至體外,故只要測定血清肌酸酐就可得知腎臟的 排泄功能。 12.尿酸 正 常 值 : 未 滿 六 點 五 mg/dl( 男 性 七 點 零 mg/dl,弱女性六點零 mg/dl 弱)。 尿酸是由老舊細胞的核中核酸成分所分解出 來的代謝產物,由腎臟排泄出來。在體內離子化 而溶於血液中。本來它是一種很不容易溶化的物 質,因此在血液中的濃度很難超過六點五 mg/dl 以上,若是超過它會在組織中呈現局部的結晶。 這時就是所謂的高尿酸血症。是腎臟無法順利地 排泄尿酸,亦即腎臟產生機能障礙所致。腎臟的 尿細管會受到尿酸結晶的損傷,這時尿中也會排 出尿酸的結晶。 不過,最近中性脂肪高的人,其尿酸值也會 並行升高,喝酒時尿酸值會上升。因此這被視為 成人病或循環系統疾病的危險因子之一。 (四)、血脂肪檢查 13.總膽固醇 正常值: ㄧ百二十二~二百二十 mg/dl。這是
- 19 -
2008 Workshop on Consumer Electronics
2008 年民生電子研討會
觀察血液中膽固醇量的指標。並沒有區分好壞膽 固醇,只是觀察在血管中流動的所有膽固醇的總 量。總膽固醇的意思也就是指壞膽固醇、好膽固 醇全體的值。如果比日本動脈硬化學會所規定的 正常值多,就是高膽固醇血症。許多團體檢診的 結果,發現在長期持續高膽固醇的狀態下,累積 於全身動脈中的膽固醇會引起動脈硬化,也是引 起心肌梗塞、狹心症、腦梗塞、閉塞性末梢動脈 硬化症等等以循環器官系統為中心的疾病之原 因。總膽固醇是因長期攝取動物性食品過多而上 昇的。 14.HDL、15LDL 膽固醇 正常值: HDL:四十 mg/dl 以上、LDL:一百 三 mg/dl 以下。一般而言,膽固醇給人的印象是 對身體不好。但是,它原本是製造細胞膜不可或 缺的重要物質。不過,在體內會因搬運狀態不同 而有好壞之分。 以往我們所知道的壞膽固醇是指由 LDL(低 比重脂蛋白)從肝臟運送到全身組織的膽固醇。相 反,將附著於全身末梢組織多餘的壞膽固醇帶回 肝臟,與 HDL(高比重脂蛋白)結合的就是好膽固 醇。 也就是說,膽固醇本身並沒有好壞之分。但 是,和 LDL 一起離開肝臟時稱壞膽固醇,與 HDL 一起回到肝臟時就稱為好膽固醇。兩者取得平衡 的狀態下,膽固醇不會積存在末梢組織。一旦平 衡瓦解,壞膽固醇就會附著在血管壁或組織,或 是 LDL 膽固醇過多,血管本身受損等,成為引起 高血壓或心臟病的原因。這時,壞膽固醇不會附 著於所有血管,主要積存在血管分枝處或形成血 流渦的地方。特徵是,最初容易附著於腹部主動 脈。動脈硬化會從腹部主動脈開始,朝上下左右 擴散開來的形態進展。好的 HDL 膽固醇量,一般 而言是四十 mg/dl 以上。若是女性,這個數字大 約多五 mg 左右。在此可由計算求得壞的 LDL 膽 固醇的量。也就是說,從總膽固醇量中減掉用五 除的 HDL 膽固醇的量與中性脂肪(三酸甘油脂)的 數值,就是 LDL 膽固醇量。平均值大約一百~二 十 mg/dl。若是一百四十 mg/dl 以上,就表示壞膽 固醇增加過多。這時,HDL 與 LDL 正常值的量 差是因兩者血液中在體內的代謝速度之差所造 成。 這些數值,不管在哪里的定期檢診都會測 量,所以大家的關心度也較高。壞的 LDL 膽固醇 會因動物性脂肪,也就是飽和脂肪酸攝取過多而 增大。奶油、猪油或冰淇淋中所含的增粘材料-椰子油--等等是飽和脂肪酸塊,因此 LDL 膽固醇 過多的人必須注意。 16.中性脂肪(三酸甘油脂) 正常值: 未滿一百五十 mg/dl。中性脂肪主要 具有熱量源的作用。典型的例子,存藏在腹部等 的皮下脂肪就是中性脂肪。存藏量比當成熱量消 耗還多時就形成肥胖的原因。當這個數值昇高
時,不僅皮下脂肪,連肝臟也會有中性脂肪附著, 造成脂肪肝。但是,這個數值可以藉著過平衡的 生活而減少。也就是說,一旦附著一個中性脂肪, 只要努力,就能加以去除。 中性脂肪會由於喝酒而上昇,連續攝取糖分 或油膩的食物也會上昇。水果是維他命源,對身 體很好,這是一般人的觀念,但水果中所含的果 糖卻是促使中性脂肪上昇的一種非常強的糖分。 中性脂肪會因膽固醇而產生很大的變化,只 要稍微飲食就會下降。相反,持續過食就會上昇。 如果經常動搖且持續高值的人,表示有高水準的 動搖傾向。中性脂肪的上昇除了肥胖、脂肪肝之 外,也會引起好膽固醇的減少、血液凝固因子上 昇、高尿酸血症等問題,因此要特別注意。 (五)、肝、膽功能檢查 17.SGOT、18SGPT 正常值: SGOT:四十單位,SGPT:三十單位。 SGOT、SGPT 是指肝臟細胞所具有的酵素。肝細 胞會新陳代謝,平常則有少量毀壞,應該存在於 肝細胞內的 SGOT、SGPT 會少量釋出到血液。一 旦其數量超出正常範圍,即表示肝細胞因疾病而 遭到破壞,酵素大量外漏。這指標也稱為「逸脫 酵素」 。通常 SGOT 四十單位,SGPT 為三十單位 是其上限。這是自然新陳代謝產生的量。若患急 性病毒性肝炎,可能會上升到一千單位,有慢性 活動性肝炎症狀,也會出現一百單位以上的三位 數數字。這時慢性肝炎的火尚未消退,經常出現 發炎症狀,細胞大量死亡的狀態,會出現這種情 況。此外,一般而言,SGOT 比較高,但是脂肪 肝時,則 SGPT 比較多。這時並不是細胞的破壞, 而是肝細胞中的三酸甘油脂積存,導致 SGPT 大 量吐出的狀態。
4. 系統模擬 4.1 醫療檢驗資料設定 本研究共收集了 340 份的健康檢查表,並將所 有的數據整理後依序列表。依照重要五大類別(尿 液檢查、血液檢查、腎功能檢查、血脂肪檢查、肝 膽功能檢查)的檢驗數據挑選出其中 18 項來做為 類神經程式的輸入:(1)酸鹼度 PH 、(2)蛋白質 Pro、(3)紅血球 RBC、(4)血色素 HGB、(5) 血球容積 HCT、(6)白血球 WCB、(7)MCV、 (8)MCH、(9)MCHC、(10)血小板 Plat、(11) 血清肌胺酸酐 Cre、(12)尿酸 UA、(13)總膽固 醇 Chol、(14)高密度脂蛋白 HDL-C、(15)低 密度脂蛋白 LDL-C、(16)三酸甘油脂 TG、(17) SGOT 及(18)SGPT,而這 18 項所取出來的比值 先進行正規化(Normalization),將 340 筆中的每ㄧ 項的數據除以每ㄧ項的最大數據,換算出後,再進 行類神經程式(MATLAB/NNTOOL)訓練,而模 擬結果的輸出數據安排有 16 個輸出值,依照檢驗
- 20 -
2008 Workshop on Consumer Electronics
2008 年民生電子研討會
輸入值對應的疾病症狀輸出排列依序為:(1)血脂 肪偏高、 (2)血脂肪過高、 (3)低密度膽固醇偏高、 (4)疑尿感染、 (5)尿液潛血(生理期)、 (6)紅血 球過低、 (7)紅血球過高、 (8)紅血球偏高、(9) 血壓偏高、(10)肝功能不全、(11)高密度膽固醇 偏低、 (12)發炎指數偏高、 (13)疑地中海型貧血、 (14)疑尿路結石、(15)尿酸過高及(16)所有 檢驗值均正常。
4.2 類神經程式結構
兩大欄位,右方的結果為程式模擬出來的結果,而 左方的結果表示健檢真實的是結果,在右方的第 10 個位元為 0.99675,雖沒有為 1,但是大於 0.7,所 以本文把這一筆的資料設為成功。 另外,以圖 2 的第 20 組(列)來說明不成功的情 況,我們的結果需要全部為 0,可是,在模擬結果 中,第 5、9 這兩個位元的結果,因為都在 0.7 以上, 所以我們把他設定為 1,又第 4、12 這兩個位元的 結果,指向不確定(正常測試結果應在 0.7 以上或 0.3 以下,出現負值或介於 0.3~0.7 之間均屬指向不明 確,列為測試結果失敗),所以這一筆資料為不成功。
利用 MATLAB/NNTOOL 的工具程式,本研究 使用了三種不同的類神經結構圖(如圖 1 所示)來 進行訓練及模擬。
表 1 類神經的分析結果 內容 組別
一
二
三
四
類神經
訓練
測試
結構
組數
組數
18-20-16
18-30-16
18-30-15
18-30-15
100
100
50
100
4.3 類神經分析結果 本文使用 340 筆檢驗數據當中隨機的 50(或 100) 筆資料當作為訓練樣本,並把其他非訓練組的資料 當作測試組,分別以隨機選取測試組當中的 100、 200 或 240 筆,三種方式送到經過類神經程式訓練 後的類神經網路模型內進行測試。表 1 所示為本文 的模擬結果。表 1 中四個組別當中 18 表示有輸入 18 項檢驗項目,15 表示為輸出 15 種的檢查結果(可 能的疑似病症),而 16 是本文刻意安排多加入的一 個檢查位元(檢驗完全正常)。類神經網路訓練停止 條件設定為; (1)目標誤差均方根值要小於 10-3, (2) 並且訓練時間最長設定為不超過 2 小時。 以表 1 中的第一組來說明,測試 100 筆的成功 率,其中所得到的結果分別是為 86%,測試 200 筆 的成功率為 84.5%,測試 240 筆的成功率為 85%, 由上述 3 組測試的成功率均相當(86%~84.5%) ,可 証明本文以隨機選取 100 組來訓練類神經結構,已 足夠訓練出精確的類神經網路模型。 圖 2 所示為本文的類神經程式模擬結果輸出 表,以圖 2 來說明其輸出結果是否準確? 本文使用 了 0.7 跟 0.3 為一個分隔點,如果是在 0.7 以上的, 我們都把其結果再修正為 1,如果是在 0.3 以下的, 我們都把其結果在修正為 0。在圖 2 第一組(列)的數 值中,分為(健檢真實)結果和模擬結果的左右邊
成功率(%)
100
86
200
84.5
240
85
100
90
200
89
240
88.75
100
49
200
49
290
48
100
76
200
75
240
75.5
4.4 類神經分析結果與討論 4.4.1 第三組和第四組結果分析 比較的方式是使用二種不同的訓練樣本數來測 試其成功率(準確率)是否有差異。 我們使用了 50 筆和 100 筆,二種不同的訓練樣 本數,分別去測試,而使用的類神經網路結構均為 18-30-15,我們可以發現到,當使用 50 筆資料測試 出來的結果,成功率最高才只有 49%,而相較起來, 使用了 100 筆資料的成功率可以到 76%,也就是 說,當 100 筆資料分別送入去測試時,如果所訓練 的樣本數不足,其成功率也不會太高。因此本文類 神經訓練樣本採用隨機的 100 筆的資料就可以得到 不錯的成功率了。 4.4.2 第二組和第四組結果分析 比較的方式是使用二種不同的類神經結構來測 試其成功率(準確率)是否有差異。 我們使用了二種不同的類神經網路結構分別去 測試,而使用的類神經網路結構為 18-30-15 和 18-30-16,其差別在本文刻意多加入了一個位元(醫
- 21 -
2008 Workshop on Consumer Electronics
2008 年民生電子研討會
療檢驗完全正常否?) ,使用了 100 筆的訓練資料。 我們可以發現到,當使用 18-30-15 筆資料測試出來 的結果,成功率最高才只有 76%,而相較起來,使 用了 18-30-16 筆資料的成功率可以到 90%,也就是 說,本文所加入的檢查位元有助於,能提高類神經 醫療資訊分析的測試成功率。 4.4.3 討論
本研究承南開科技大學醫療器材技術研發中心 研究計畫(95C012)及傑程科技股份有限公司的研究 經費支持,表示謝意。同時,特別要感謝提供本文 寶貴個人健檢資料,以進行純學術研究的 340 位朋 友,謹此致謝。
參考文獻
根據本文上述的比較,可發現到其中第二組 (18-30-16)的成功率最高,這種設計的類神經結構最 適合應用於醫療資訊分析。
5. 醫療資訊網站的建置與管理 本文利用 Appserv 2.4.4a 版軟體[13]來建置「醫 療資訊建置與管理」網站。本網站具有下列功能: (1)會員管理機制:主要包含三個功能:註冊、認證、 帳號管理、(2) 註冊機制:註冊最重要的一件事就 是設定帳號密碼,也就是說,到時候要看健康檢查 的資料,得先用帳號密碼來登入才可以,如此,也 可以避免他人(第三人)任意隨意觀看個人健康檢查 資料、(3)認證機制:判斷使用者的帳號密碼是否正 確、(4)帳號管理機制:本網站所提供資料修改的功 能,例如使用者可修改密碼,或修改 Email。 本文之「醫療資訊建置管理系統」的使用者端 主功能有;(1)新增、修改健康檢查資料:提供使用 者新增和修改健康檢查資料的功能、(2)可能症狀判 斷:使用者將輸入的個人健康檢查資料,傳入資料 庫中,並判定可能的症狀輸出,同時包涵將症狀列 印的功能。上述各功能的畫面分別如圖 3~ 圖 7 所 示。
[1] K. B. Goh, and W. L. Chiang, “The application of fuzzy set and neural network in system identification and classification,” Uncertainty Modeling and Analysis, Proceedings, 2nd Int. Symposium, April, 1993, pp 145 –152. [2] Y. Hirose, K. Yamashita, and S. Hijiya, “Back-propagation algorithm which varies the number of hidden units”, Neural Networks, 4, 1991, pp 61-66. [3] C. L. Chiang, “Improved Genetic Algorithm,” Proc. of 9th TAAI Conference, Evolutionary Computation (SP1-04), Taipei, 2004, pp. 1-6. [4] D. Nuyenand B. Widrow, “The truck backer-upper: an example of self- learning in neural networks,” Proc. of the 1989 Neural Networks Joint Conf., vol. 2, pp. 357- 363, 1989. [5] S. Gava, J. Sitte, and G. Willshire, “ A one neural truck backer-upper,” Proc. of the 1992 Neural Networks Joint Conf., vol. 2, pp. 850- 856, 1992. [6] 周鵬程,類神經網路入門,全華科技圖書股份 有限公司,2004。 [7] 葉怡成,類神經網路模式應用與實作,儒林圖 書股份有限公司,1998。 [8] 蘇木春、張孝德,機械學習:類神經網路、模糊 系統以及基因演算法則,全華科技股份有限公 司,1999。
6. 結論 本文運用事先收集之大量的健檢資料(340 人的 健康檢查表)加以分類及整理後,利用類神經網路程 式進行訓練與測試,得出有效的醫療檢驗項目與人 體疾病的關聯性(類神經模型),經過三個類神經結 構的比較分析後,驗證得到本文的成果具有高度準 確度。最後建構醫療資訊網站,將類神經分析出的 醫療檢驗項目與人體疾病之關聯模式提供大眾使 用。藉由本文「醫療資訊建置與管理系統」的成果, 能提供給醫生診斷的輔助參考,協助其作出更有效 的專業疾病判斷,及降低醫師的工作負擔,因此本 文的成果的確具有很高的實用性及使用方便性。
[9] 張斐章、張麗秋,類神經網路,東華書局,2006。 [10] C. T. Lin and C. S. G. Lee, Neural fuzzy
systems: a neuro-fuzzy synergism to intelligent systems, Prentice-Hall Inc., A Simon & Schuster Company, 1996. [11] 游蘇寧,認識身體正常值,林鬱股份有限公司, 2001。 [12] 秦葭哉,如何了解全身健康檢查?,主婦之友出 版事業有限公司,1998。 [13] http://www. Appservnetwork.com
致謝
- 22 -
2008 Workshop on Consumer Electronics
2008 年民生電子研討會
- 23 -
2008 Workshop on Consumer Electronics
2008 年民生電子研討會
- 24 -
2008 Workshop on Consumer Electronics