撰文 | 我的闺蜜老红帽
在前列腺癌的研究和治疗过程中,患者的基因型与临床表现型如何一一对应是这领域研究重点和难点【1,2】 。随着机器学习在生物医学领域的广泛应用,使得由基因组预测和发现潜在癌症风险成为可能【3-5】 。
2021 年 9 月 22 日,来自美国丹纳 · 法博癌症研究中心的Eliezer M Van Allen课题组在Nature 上发表题为Biologically informed deep neural network for prostate cancer discovery 的文章,构建了名为 P-NET、以生物信息学为基础的深度机器学习模型。通过这一模型,可以为处于治疗耐受状态的前列腺癌病人预测新的治疗靶标。
具体来说,作者基于生物神经网络的层级概念,整合了 3007 组生物网络图谱,构建了一个深度学习预测模型,输入前列腺癌病人的基因组,通过计算,第一层可以输出一系列基因簇,这些基因簇之间可以通过带有权重的线相连接;第二层则是相关的生物学通路;接下来是整合这些通路所预测的可能生物现象及结论,依此类推,最终可以预测这一病人的病情。
作者采集了 1013 位前列腺癌病人的资料,其中 80% 用于模型训练,10% 用于模型校正,剩余 10% 用于检测这一模型的正确率。从结果来看,在输入相同体量的样本情况下,作者所构建的 P-NET 模型准确率要优于已知的深度机器学习模型。
接下来,作者将这一模型用于实践。作者招募了两组前列腺癌病人,一组是处于原发状态,另一组癌症病灶已经发生转移。结果显示,P-NET 模型可以准确预测 73% 的原发状态和 80% 的已转移状态。作者猜测,之所以有几例处于原发状态的病人被 P-NET 模型归为已转移状态,很可能是因为这几例病人病情较为严重,P-NET 评分较高所致。从另一方面来说,这一模型在预测病人所处状态之余,还可以通过 P-NET 评分来显示病情严重程度。
再下来,为了研究不同的基因、信号通路和生物学网络之间的相互作用以及对模型预测结果的影响,作者用示意图的形式显示了这一模型的输出的整体结构(如下图所示)。
在前列腺癌病人众多的基因组层面变化中,基因拷贝数的变化对病情影响要高于基因突变本身。另外,在 P-NET 所涵盖的 3007 组信号通路中,多条细胞周期相关通路与已转移状态相关,而泛素化和 SUMO 化信号通路则与多种肿瘤抑制因子相关,包括 AR,这些通路异常很可能会导致前列腺癌发病。例如,骨源转录因子 RUNX2 可以调控细胞周期,且与前列腺癌转移相关。
再下来作者通过 P-NET 模型预测出一系列与癌症进程相关的基因。重点关注的基因包括AR, PTEN, RB1 和TP53 ,都是已知的前列腺癌驱动基因,之前也被报道与肿瘤转移相关。另外,有一些基因,比如MDM4, FGFR1, NOTCH1 和PDGFA ,与预测结果的准确性相关。
最后,作者深入分析 P-NET 模型输出的各级信息,发现 TP53 相关通路与摘除性器官治疗效果有限的前列腺癌相关。有报道指出,TP53 以及其通路重要基因 MDM2 与前列腺癌病程相关,作者同样发现,MDM4 这一基因很可能也有类似的作用。而在此前,已知 MDM4 可以通过与 TP53 的转录区域相结合来抑制 TP53 的表达,但与前列腺癌疾病进程之间的关系仍旧不够清楚。为了进一步研究 MDM4 这一基因的具体作用,作者通过 CRISPR–Cas9 的方法,在多种前列腺癌细胞系中特异性敲除了 MDM4。结果显示,与对照组细胞相比,特异敲除 MDM4 的细胞增殖水平明显降低。另外,含有野生型 TP53 的前列腺癌细胞系,对 MDM4 抑制剂 RO-5963 与 TP53 突变的细胞系相比更为敏感。
综上所述,作者给出了通过神经网络模式,基于深度机器学习建立模型,从而解决生物学问题的新方法。并且,作者证实,通过这一模型,可以由前列腺癌病人的基因测序结果预测病人所属的疾病状态。 另外,通过模型的输出信息,作者还预测了一些新的靶标,比如 MDM4,很可能与前列腺癌病程相关,并通过体外敲除的方法证实,MDM4 缺失可以抑制前列腺癌细胞的增殖。更进一步说,这一模型以及相关研究方法,也有希望推广至多种癌症类型。
原文链接:
https://www.nature.com/articles/s41586-021-03922-4
制版人:十一
参考文献
- Robinson, D., et al. Integrative clinical genomics of advanced prostate cancer. Cell 161, 1215–1228 (2015).
- Abida, W., et al. Genomic correlates of clinical outcome in advanced prostate cancer. Proc. Natl Acad. Sci. USA 116, 11428–11436 (2019).
- Ma, J., et al. Using deep learning to model the hierarchical structure and function of a cell. Nat Methods 15, 290–298 (2018).
- Yang, J. H., et al. A white-box machine learning approach for revealing antibiotic mechanisms of action. Cell 177, 1649–1661.e9 (2019).
- Kuenzi, B. M., et al. Predicting drug response and synergy using a deep learning model of human cancer cells. Cancer Cell 38, 672–684.e6 (2020).
转载须知
【原创文章】BioArt 原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为 BioArt 所拥有。BioArt 保留所有法定权利,违者必究。