以大數據抗擊大疾病

「人為何生病?如何避免病倒?人又因何而死?」對於在童年時已思考這些問題的王吉光教授來說,問對的問題非常重要。時至今日,這位數據科學家每天也在思考怎樣善用數據治療致命疾病,以及可否以更新、更有效的方法治療癌症。

王教授現為科大生命科學部兼化學及生物工程學系副教授,更是計算生物學領域的新星。這門學科使用計算法分析收集所得的大量生物及醫學數據,以便科研人員在掌握充足資訊的情況下作出預測或決策。正因如此,王教授得以在診治腦癌等最棘手的頑疾時屢次突破瓶頸,取得重大進展。

運用機器學習技術斷症

傳統的醫學診治方式主要是由外科醫生憑經驗作出臨床判斷。然而,王教授的科研團隊多年來一直嘗試借鑑和參考來自世界各地的客觀臨床數據,從中研發數學模型及機器學習方法,尋找理想的治療方案。
應用數學訓練出身的王教授直言:「如能從數據庫中找到與病人病況相近的例子,就像找到『虛擬的雙胞胎』一樣,那麼就可較準確地預測病人存活率和治療效果。」 

為此,他與不同的夥伴機構合作,例如北京天壇醫院會收集腦癌患者的臨床數據,再交予其團隊檢測、處理、勘探出有用資訊及研發演算法。

2021年,其團隊便與天壇醫院聯合發現一個能導致非家族遺傳病人患上腦海綿狀血管瘤(CCM)的突變基因。CCM是一種腦血管病變,全球患者人數達一千至三千萬人。然而,僅有兩成的CCM病例有已知病因,餘下的非家族遺傳個案仍然成因不明。

團隊運用計算法分析了CCM患者的基因體數據,發現一種名為MAP3K3-I441M的新基因突變,並證實這突變與磁力共振(MRI)成像所顯示的腦部損傷有關。團隊的研究結果顯示,腦部出現「爆谷狀」腫瘤的病人,幾乎都會出現上述基因突變。此重大發現使醫生能早日進行分子診斷,減少倚賴手術斷症,從而降低病人在手術中出現腦出血、腦神經功能缺損等嚴重風險。

從數學家到科學家

王教授憑上述的卓越科研成就屢奪國家級榮譽,包括國家自然科學基金「2019年度優秀青年科學基金」,以及2022年「鍾南山青年科技創新獎」。在後者公布的首屆10人獲獎名單中,王教授是唯一來自香港的得獎者。

他說:「我很高興獲得這份榮譽。無論對我本人或整個團隊,也是叫人鼓舞的喜訊!跨學科研究仍處於起步階段,亦面對不少挑戰。今次得獎,顯示在醫學上應用數據科學的重要性與日俱增。」

王教授2011年於中國科學院數學與系統科學研究院取得應用數學博士學位,曾與導師深入研究以數學最佳化理論解決生物學的疑難,並致力研發工具去理解複雜網絡的拓撲結構。

其後,他於哥倫比亞大學生物醫學信息學系從事博士後研究,2015年晉升為該系副研究科學家,翌年加入科大。

王教授說:「我有應用數學底子,將生物學問題視作計算學問題處理,感覺是順理成章的事。我有些在金融界工作的博士班同學,在分析最佳投資組合時,用的也是同一套數學計算工具,分別只在我選擇了生物醫學領域。」

已是兩兒之父的王教授透露,年幼時已立志成為科學家。他微笑著說:「家人非常支持我成為科學家。我爸從事教育,擅長教授數學、物理、化學等科目。在我心裡,一直覺得當科學家是最理想的工作。」

治療腦癌新突破

近年,他主力研究癌症,尤其專注最棘手的類型,務求了解其突變機制及可行的精準治療方案。

王教授現正鑽研第四級腦膠質瘤的基因突變機制。這是一種罕見卻致命的腦癌,每年每十萬人中,便有三四人患病,目前無藥可治,患者確診後平均只有15至18個月壽命。 

其所屬團隊經過幾番努力,發現了導致低級別腦膠質瘤惡化為繼發性腦膠質瘤(sGBM)的機制。sGBM是第四級腦膠質瘤的分支,以年輕患者最受影響。這項與北京神經外科研究所合作的研究,揭示了一種名為METex14的關鍵基因突變,有助晚期腦癌病人進行標靶治療。

現時,團隊已經展開第二及第三期臨床試驗,旨在進一步驗證上述研究發現。叫人鼓舞的是,團隊所發現的腫瘤細胞抑制劑,在對化療產生抗藥性的sGBM病人身上取得顯著效果,說明這種精準療法具備優厚的臨床應用潛質。

他說:「這是我最引以為榮的成就,因為我們的研究結果直接惠及病人。」

王教授也研究乳癌、結腸癌、前列腺癌等其他癌症類別。根據其研究所得,將癌病分類時,可以採用嶄新和更有效的方法。

「在成因和治療方法上,不同類型癌症或會有共通之處。因此,出現相同基因突變情況的不同類型癌症,也許都能以同一方式治療。換言之,我們可以按照基因組重新將新確診的病人分類,為他們度身設計理想治療方案。」

這個嶄新理念促使他研發名為 MetaNet的計算模型,幫助腫瘤學家評估原發性腫瘤的擴散風險,以及可能受影響的器官。只需簡單輸入腫瘤的臨床、組織學及基因組特徵,研究人員就可比照數據庫中逾三萬宗癌症病例,估計癌細胞擴散的機會。王教授相信這個公開的網上平台,將有助改善轉移性癌症的分期和病情預測。

讓病人掌握資訊

王教授的團隊現正研發一套網上病情預測工具,讓醫生、研究人員和病人可以預測病況發展及一些治療方案的成效。病人屆時只需上載自己的基因組及臨床數據,具備機器學習功能的計算工具便能分析出答案。

近幾年,王教授和團隊一直致力創建一個供用家自由取用的網上臨床數據庫,而這項病況評估工具將會是數據庫的重要功能之一。有了這個數據庫,科研人員就可在尋找最適切的治療方案時互學互助。數據庫完成後,將糅合基因組學、成像及人工智能技術,自動為病人診症及預測治療方法。

王教授估計這項目可望在大約五年內準備就緒:「要創建這樣的數據庫,技術上不難做到,但必須解決一些關鍵問題,像控制原始數據質素、整合不同源頭和模式的數據,保障病人隱私,以至處理知識產權等等。」

他希望平台能開放予公眾使用,方便病人提供新的數據,並深信提供資料的人越多,數據庫便能惠及越多病人。

王教授鼓勵有意借鑑其思考方式的後輩勇於提問,而不是只管尋找答案。

他說:「解決問題其實沒那麼困難,最難的反而是問對問題!有些時候,解決不了問題,是因為並沒有真正找到問題所在。」
那麼,怎樣才能問對問題呢?王教授總結:「我建議大家先問自己兩條問題:一、你能否為心中的問題找到答案?二、你的問題對人有沒有價值?如兩者的答案都是肯定的話,該問題也許值得認真對待了。」