科学研究

电子学系雷易鸣、北京大学第三医院妇产科郭红燕与合作者在基于机器学习辅助的人类卵巢癌耐药性预测方法研究领域取得重要进展

发布时间:2021-05-13

信息来源:电子学系

基因相互作用是指个体基因与其他基因共同影响蛋白质结构和生物学过程的现象,对于揭示基因及其对应蛋白质之间的功能关系有着重要作用。在复杂疾病的基因研究中,基因相互作用一直以来都是较大的难点。在基因测序技术快速发展的今天,如何利用有限样本数量对化疗耐药性和大量基因之间定量关系进行准确预测,不但是临床医生关注的重要问题,也成为医学和信息领域交叉研究的重要课题。

电子学系雷易鸣博士、北京大学第三医院妇产科郭红燕教授与澳大利亚新南威尔士大学、英国剑桥大学、美国杜克大学的研究人员合作,在基于机器学习辅助的人类卵巢癌耐药性预测方法研究领域取得重要进展。在该研究中,考虑到过往研究中存在基因维度过高导致基因相互作用网络非常复杂而难以理解,研究人员首先构建了一个基于梯度提升决策树的机器学习模型来选取标志基因。进而,研究人员提出了基因相互作用系数来定量衡量两个标志基因的相关性,并以此建立卵巢癌耐药性的基因相互作用网络。最后,研究人员提出了一种基于标志基因对的卵巢癌耐药性预测方法。

机器学习算法流程图,包含个体标志基因识别、标志基因对识别、基于基因对的基因对相互作用系数分析

测试结果表明,标志基因对的预测性能显著优于个体标志基因的预测性能。 从2.5万原始个体基因可组成的超过6亿个基因对组中,共筛选出24个标志基因对组(仅包含10个标志基因)。采用标志基因对组进行化疗耐药性预测的准确率达到97%,而传统的基于个体标志基因的预测的准确率仅为68%。这说明筛选出的标志基因对不仅可以形成卵巢癌耐药性的基因相互作用网络,还为卵巢癌耐药性的预测提供了一种新的方法。实验中准确率的显著提升表明,该方法是研究卵巢癌耐药性相关的基因相互作用的有效工具。

由卵巢癌化疗耐药性个体特征基因组成的基因互作网络图

上述研究成果以“Integration and interplay of machine learning and bioinformatics approach to identify genetic interaction related to ovarian cancer chemoresistance”为题,于2021年5月由学术期刊《生物信息学简报》(Briefings in Bioinformatics)在线发表。其中,北京大学元培学院2016级本科生陈柯辛(已毕业,现为雷易鸣博士课题组科研实习生)、美国杜克大学徐浩铭为该论文的共同第一作者。英国剑桥大学计算机系Pietro Lio教授,北京大学第三医院妇产科李园博士参与了该论文的部分工作。电子学系雷易鸣博士、北京大学第三医院妇产科郭红燕教授、澳大利亚新南威尔士大学数字医疗中心M. A. Moni博士为该论文的共同通信作者。上述研究工作得到宁夏自治区重点研发计划项目的支持。

论文链接:https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab100/6272796?guestAccessKey=279751ca-4cb0-4390-a704-9edc21be3a96