写在前面

  • 以下内容均来自我在菲沙基因(Frasergen)暑期生信培训班上记录的课堂笔记

    1.Compartment计算

    三维基因组技术(四):Compartment 分析流程 - 图1

    2.Compartment 分析流程

    2.1 Cworld-dekker软件的安装
    ```bash git clone https://github.com/blajoie/cworld-dekker.git

    Change directory to the cworld-dekker and install the Perl module:

    perl Build.PL ./Build ./Build install —install_base /your/custom/dir (ensure /your/custom/dir is added to your PERL5LIB path)

e.g.

./Build install —install_base ~/perl5

then in .bashrc

export PERL5LIB=${PERL5LIB}:/home//perl5/lib/perl5

  1. <a name="nsUeL"></a>
  2. ##### 2.2 分析所用数据
  3. 互作图谱分染色体matrix数据,如何获得请看:[生信 | 三维基因组技术(三):Hi-C 数据比对及HiC-Pro的使用](https://www.jianshu.com/p/bb5512dfa29c)<br />matrix数据<br />![](https://cdn.nlark.com/yuque/0/2021/webp/655888/1627979566691-fa5871e9-71ad-4155-9109-4278471cc728.webp#clientId=u21f5f96f-3ed0-4&from=paste&id=u1a33faa9&margin=%5Bobject%20Object%5D&originHeight=335&originWidth=821&originalType=url&ratio=1&status=done&style=none&taskId=u4ca8f528-04c9-4b48-8604-d3382e3e5c8)
  4. <a name="z3rJ7"></a>
  5. ##### 2.3 为矩阵添加header
  6. header文件需要自己准备,操作采用cworld的addMatrixHeaders为矩阵文件添加header
  7. ```bash
  8. perl -I /software/cworld-dekker/ \
  9. /software/cworld-dekker/scripts/perl/addMatrixHeaders.pl \
  10. -i data/example.matrix \
  11. --xhf data/headerxchr1 \
  12. --yhf data/headerychr1

-I:添加cworld的库,连接到cworld软件所在目录即可
-i:matrix 文件
—xhf:横坐标表头
—yhf:纵坐标表头
自制Header文件,横纵坐标可以相同,形如:
三维基因组技术(四):Compartment 分析流程 - 图2
结果文件
三维基因组技术(四):Compartment 分析流程 - 图3

2.4 扣除背景/计算z-scale

操作采用cworld的matrix2loess.pl

  1. #export PATH=/software/R/R-3.5.0/bin/:$PATH
  2. #export PATH=/software/bedtools/bedtools2-2.28.0/bin/:$PATH
  3. perl -I /software/cworld-dekker/ \
  4. /software/cworld-dekker/scripts/perl/matrix2loess.pl \
  5. -i example.addedHeaders.matrix.gz

结果文件以zScore.matrix.gz结尾
三维基因组技术(四):Compartment 分析流程 - 图4

2.5 转换相关矩阵与PCA分析同时进行

采用cworld的matrix2EigenVectors.py,需要给一个example_gene.bed文件。
example_gene.bed
三维基因组技术(四):Compartment 分析流程 - 图5

  1. python software/cworld-dekker/scripts/python/matrix2EigenVectors.py \
  2. -i example.addedHeaders.zScore.matrix.gz \
  3. -r data/example_gene.bed

结果文件以compartments结尾。
三维基因组技术(四):Compartment 分析流程 - 图6

另外生成的图片以compartments.png结尾
定义基因密度较高的区域为compartmentsA,反之为compartmentsB

三维基因组技术(四):Compartment 分析流程 - 图7


作者:Bioinfo鱼
链接:https://www.jianshu.com/p/bb5512dfa29c
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。