Nature | 机器学习在前列腺癌疾病预测中的应用 - 图1

    撰文 | 我的闺蜜老红帽

    在前列腺癌的研究和治疗过程中,患者的基因型与临床表现型如何一一对应是这领域研究重点和难点【1,2】 。随着机器学习在生物医学领域的广泛应用,使得由基因组预测和发现潜在癌症风险成为可能【3-5】

    2021 年 9 月 22 日,来自美国丹纳 · 法博癌症研究中心的Eliezer M Van Allen课题组在Nature 上发表题为Biologically informed deep neural network for prostate cancer discovery 的文章,构建了名为 P-NET、以生物信息学为基础的深度机器学习模型。通过这一模型,可以为处于治疗耐受状态的前列腺癌病人预测新的治疗靶标。

    Nature | 机器学习在前列腺癌疾病预测中的应用 - 图2

    具体来说,作者基于生物神经网络的层级概念,整合了 3007 组生物网络图谱,构建了一个深度学习预测模型,输入前列腺癌病人的基因组,通过计算,第一层可以输出一系列基因簇,这些基因簇之间可以通过带有权重的线相连接;第二层则是相关的生物学通路;接下来是整合这些通路所预测的可能生物现象及结论,依此类推,最终可以预测这一病人的病情。

    作者采集了 1013 位前列腺癌病人的资料,其中 80% 用于模型训练,10% 用于模型校正,剩余 10% 用于检测这一模型的正确率。从结果来看,在输入相同体量的样本情况下,作者所构建的 P-NET 模型准确率要优于已知的深度机器学习模型。

    接下来,作者将这一模型用于实践。作者招募了两组前列腺癌病人,一组是处于原发状态,另一组癌症病灶已经发生转移。结果显示,P-NET 模型可以准确预测 73% 的原发状态和 80% 的已转移状态。作者猜测,之所以有几例处于原发状态的病人被 P-NET 模型归为已转移状态,很可能是因为这几例病人病情较为严重,P-NET 评分较高所致。从另一方面来说,这一模型在预测病人所处状态之余,还可以通过 P-NET 评分来显示病情严重程度。

    再下来,为了研究不同的基因、信号通路和生物学网络之间的相互作用以及对模型预测结果的影响,作者用示意图的形式显示了这一模型的输出的整体结构(如下图所示)。

    Nature | 机器学习在前列腺癌疾病预测中的应用 - 图3

    在前列腺癌病人众多的基因组层面变化中,基因拷贝数的变化对病情影响要高于基因突变本身。另外,在 P-NET 所涵盖的 3007 组信号通路中,多条细胞周期相关通路与已转移状态相关,而泛素化和 SUMO 化信号通路则与多种肿瘤抑制因子相关,包括 AR,这些通路异常很可能会导致前列腺癌发病。例如,骨源转录因子 RUNX2 可以调控细胞周期,且与前列腺癌转移相关。

    再下来作者通过 P-NET 模型预测出一系列与癌症进程相关的基因。重点关注的基因包括AR, PTEN, RB1TP53 ,都是已知的前列腺癌驱动基因,之前也被报道与肿瘤转移相关。另外,有一些基因,比如MDM4, FGFR1, NOTCH1PDGFA ,与预测结果的准确性相关。

    最后,作者深入分析 P-NET 模型输出的各级信息,发现 TP53 相关通路与摘除性器官治疗效果有限的前列腺癌相关。有报道指出,TP53 以及其通路重要基因 MDM2 与前列腺癌病程相关,作者同样发现,MDM4 这一基因很可能也有类似的作用。而在此前,已知 MDM4 可以通过与 TP53 的转录区域相结合来抑制 TP53 的表达,但与前列腺癌疾病进程之间的关系仍旧不够清楚。为了进一步研究 MDM4 这一基因的具体作用,作者通过 CRISPR–Cas9 的方法,在多种前列腺癌细胞系中特异性敲除了 MDM4。结果显示,与对照组细胞相比,特异敲除 MDM4 的细胞增殖水平明显降低。另外,含有野生型 TP53 的前列腺癌细胞系,对 MDM4 抑制剂 RO-5963 与 TP53 突变的细胞系相比更为敏感。

    综上所述,作者给出了通过神经网络模式,基于深度机器学习建立模型,从而解决生物学问题的新方法。并且,作者证实,通过这一模型,可以由前列腺癌病人的基因测序结果预测病人所属的疾病状态。 另外,通过模型的输出信息,作者还预测了一些新的靶标,比如 MDM4,很可能与前列腺癌病程相关,并通过体外敲除的方法证实,MDM4 缺失可以抑制前列腺癌细胞的增殖。更进一步说,这一模型以及相关研究方法,也有希望推广至多种癌症类型。

    原文链接:

    https://www.nature.com/articles/s41586-021-03922-4

    制版人:十一

    参考文献

    1. Robinson, D., et al. Integrative clinical genomics of advanced prostate cancer. Cell 161, 1215–1228 (2015).
    2. Abida, W., et al. Genomic correlates of clinical outcome in advanced prostate cancer. Proc. Natl Acad. Sci. USA 116, 11428–11436 (2019).
    3. Ma, J., et al. Using deep learning to model the hierarchical structure and function of a cell. Nat Methods 15, 290–298 (2018).
    4. Yang, J. H., et al. A white-box machine learning approach for revealing antibiotic mechanisms of action. Cell 177, 1649–1661.e9 (2019).
    5. Kuenzi, B. M., et al. Predicting drug response and synergy using a deep learning model of human cancer cells. Cancer Cell 38, 672–684.e6 (2020).

    转载须知

    【原创文章】BioArt 原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为 BioArt 所拥有。BioArt 保留所有法定权利,违者必究。

    Nature | 机器学习在前列腺癌疾病预测中的应用 - 图4
    https://mp.weixin.qq.com/s/K0Oq01qQOF5NGaqEZQ3eKg