以大数据抗击大疾病

「人为何生病?如何避免病倒?人又因何而死?」对於在童年时已思考这些问题的王吉光教授来说,问对的问题非常重要。时至今日,这位数据科学家每天也在思考怎样善用数据治疗致命疾病,以及可否以更新、更有效的方法治疗癌症。

王教授现为科大生命科学部兼化学及生物工程学系副教授,更是计算生物学领域的新星。这门学科使用计算法分析收集所得的大量生物及医学数据,以便科研人员在掌握充足资讯的情况下作出预测或决策。正因如此,王教授得以在诊治脑癌等最棘手的顽疾时屡次突破瓶颈,取得重大进展。

运用机器学习技术断症

传统的医学诊治方式主要是由外科医生凭经验作出临床判断。然而,王教授的科研团队多年来一直尝试借鑑和参考来自世界各地的客观临床数据,从中研发数学模型及机器学习方法,寻找理想的治疗方案。

应用数学训练出身的王教授直言:「如能从数据库中找到与病人病况相近的例子,就像找到『虚拟的双胞胎』一样,那麽就可较準确地预测病人存活率和治疗效果。」 

为此,他与不同的夥伴机构合作,例如北京天坛医院会收集脑癌患者的临床数据,再交予其团队检测、处理、勘探出有用资讯及研发演算法。

2021年,其团队便与天坛医院联合发现一个能导致非家族遗传病人患上脑海绵状血管瘤(CCM)的突变基因。CCM是一种脑血管病变,全球患者人数达一千至叁千万人。然而,仅有两成的CCM病例有已知病因,馀下的非家族遗传个案仍然成因不明。

团队运用计算法分析了CCM患者的基因体数据,发现一种名为MAP3K3-I441M的新基因突变,并證实这突变与磁力共振(MRI)成像所显示的脑部损伤有关。团队的研究结果显示,脑部出现「爆谷状」肿瘤的病人,几乎都会出现上述基因突变。此重大发现使医生能早日进行分子诊断,减少倚赖手术断症,从而降低病人在手术中出现脑出血、脑神经功能缺损等严重风险。

从数学家到科学家

王教授凭上述的卓越科研成就屡夺国家级荣誉,包括国家自然科学基金「2019年度优秀青年科学基金」,以及2022年「锺南山青年科技创新奖」。在後者公布的首届10人获奖名单中,王教授是唯一来自香港的得奖者。

他说:「我很高兴获得这份荣誉。无论对我本人或整个团队,也是叫人鼓舞的喜讯!跨学科研究仍处於起步阶段,亦面对不少挑战。今次得奖,显示在医学上应用数据科学的重要性与日俱增。」

王教授2011年於中国科学院数学与系统科学研究院取得应用数学博士学位,曾与导师深入研究以数学最佳化理论解决生物学的疑难,并致力研发工具去理解複杂网络的拓撲结构。

其後,他於哥伦比亚大学生物医学信息学系从事博士後研究,2015年晋升为该系副研究科学家,翌年加入科大。

王教授说:「我有应用数学底子,将生物学问题视作计算学问题处理,感觉是顺理成章的事。我有些在金融界工作的博士班同学,在分析最佳投资组合时,用的也是同一套数学计算工具,分别只在我选择了生物医学领域。」

已是两儿之父的王教授透露,年幼时已立志成为科学家。他微笑著说:「家人非常支持我成为科学家。我爸从事教育,擅长教授数学、物理、化学等科目。在我心里,一直觉得当科学家是最理想的工作。」

治疗脑癌新突破

近年,他主力研究癌症,尤其专注最棘手的类型,务求了解其突变机制及可行的精準治疗方案。

王教授现正钻研第四级脑胶质瘤的基因突变机制。这是一种罕见却致命的脑癌,每年每十万人中,便有叁四人患病,目前无药可治,患者确诊後平均只有15至18个月寿命。 

其所属团队经过几番努力,发现了导致低级别脑胶质瘤恶化为继发性脑胶质瘤(sGBM)的机制。sGBM是第四级脑胶质瘤的分支,以年轻患者最受影响。这项与北京神经外科研究所合作的研究,揭示了一种名为METex14的关键基因突变,有助晚期脑癌病人进行标靶治疗。

现时,团队已经展开第二及第叁期临床试验,旨在进一步验證上述研究发现。叫人鼓舞的是,团队所发现的肿瘤细胞抑制剂,在对化疗产生抗药性的sGBM病人身上取得显著效果,说明这种精準疗法具备优厚的临床应用潜质。

他说:「这是我最引以为荣的成就,因为我们的研究结果直接惠及病人。」

王教授也研究乳癌、结肠癌、前列腺癌等其他癌症类别。根据其研究所得,将癌病分类时,可以采用崭新和更有效的方法。

「在成因和治疗方法上,不同类型癌症或会有共通之处。因此,出现相同基因突变情况的不同类型癌症,也许都能以同一方式治疗。换言之,我们可以按照基因组重新将新确诊的病人分类,为他们度身设计理想治疗方案。」

这个崭新理念促使他研发名为 MetaNet的计算模型,帮助肿瘤学家评估原发性肿瘤的扩散风险,以及可能受影响的器官。只需简单输入肿瘤的临床、组织学及基因组特徵,研究人员就可比照数据库中逾叁万宗癌症病例,估计癌细胞扩散的机会。王教授相信这个公开的网上平台,将有助改善转移性癌症的分期和病情预测。

让病人掌握资讯

王教授的团队现正研发一套网上病情预测工具,让医生、研究人员和病人可以预测病况发展及一些治疗方案的成效。病人届时只需上载自己的基因组及临床数据,具备机器学习功能的计算工具便能分析出答案。

近几年,王教授和团队一直致力创建一个供用家自由取用的网上临床数据库,而这项病况评估工具将会是数据库的重要功能之一。有了这个数据库,科研人员就可在寻找最适切的治疗方案时互学互助。数据库完成後,将糅合基因组学、成像及人工智能技术,自动为病人诊症及预测治疗方法。

王教授估计这项目可望在大约五年内準备就绪:「要创建这样的数据库,技术上不难做到,但必须解决一些关键问题,像控制原始数据质素、整合不同源头和模式的数据,保障病人隐私,以至处理知识产权等等。」

他希望平台能开放予公众使用,方便病人提供新的数据,并深信提供资料的人越多,数据库便能惠及越多病人。

王教授鼓励有意借鑑其思考方式的後辈勇於提问,而不是只管寻找答案。

他说:「解决问题其实没那麽困难,最难的反而是问对问题!有些时候,解决不了问题,是因为并没有真正找到问题所在。」

那麽,怎样才能问对问题呢?王教授总结:「我建议大家先问自己两条问题:一、你能否为心中的问题找到答案?二、你的问题对人有没有价值?如两者的答案都是肯定的话,该问题也许值得认真对待了。」