pre程序

使用pre程序将HiC-Pro的结果转化成.hic文件。

首先需要将HiC-Pro得到的rawdata结果转化成pre输入文件格式,同时考虑到hic数据太大,因此写个多进程的python脚本转化一下HiC-Pro的结果

pre输入文件格式

如果没有酶切的信息的话,就随便使用一个数字对其进行填充

<str1> <chr1> <pos1> <frag1> <str2> <chr2> <pos2> <frag2>
  • str = strand (0 for forward, anything else for reverse)

  • chr = chromosome (must be a chromosome in the genome)

  • pos = position

  • frag = restriction site fragment

python脚本

大概能够处理最大20G的文件,大了的话还是需要用split分割一下;之后再改进这个脚本

  • -s脚手架前称

  • -i输入文件

  • -t进程数

  • -o输出文件

48G的文件还是大了,分4份跑一下看看

Pre转化格式

  • -r指定以10K分辨率进行计算

报错

染色体需要排好序,使得程序尽量减少内存的消耗

http://aidenlab.org/forum.html?place=msg%2F3d-genomics%2FbPAm69WEXVg%2F9_o_RcdrBAAJ

NjuOmj.png

测试数据

pre提交LSF任务

HiCCUPs任务

Last updated

Was this helpful?