鉴定两个基因组之间重排
SyRI uses whole genome alignments as input. Users can use any aligner of their choice. SyRI accepts alignment input in SAM/BAM format or in a
tab-separated value
format with CIGAR string information for each alignment. If the user wants to use MUMmer, then.delta
file can be used in place of CIGAR strings. See fileformat for more information.
当使用MUMer的结果作为软件的输入的时候,最后一列比对情况的代码可以使用.delta
文件代替。
1.首先使用MUMER
获取全基因组的比对结果
MUMER
获取全基因组的比对结果将会生成一个
out.delta
文件
refgenome 是当做参考基因组
qrygenome 当做查询的基因组
2.过滤比对的结果和转化格式
使用
delta-filter
过滤结果show-coords
将结果转化成TAB分割的文件
3.鉴定染色质间的重排
需要两个基因组的比对结果和基因组的序列信息,用于鉴定结构变异和重排以及局部变异(SNP、indel、CNV等)。
-c
两个基因组得到的结构变异坐标文件-r
A基因组的序列文件-q
B基因组的序列文件-d
MUMER得到的.delta
文件nc
核心数目-k
保留中间文件
两个基因组中的同源染色体需要来自同一条链。如果染色体来自不同的链,则染色体之间的比对将被颠倒。由于SyRI找共线性区域然后检查同向的比对,因此它将无法找到共线性区域,并且可能会崩溃。 该问题的当前解决方案是手动检查alignments。如果同源染色体之间的大多数比对是反向的,则查询基因组中的染色体需要反向互补。然后,需要将校正后的查询基因组与参考基因组进行比对。我们正在研究一种可以生成点图以自动识别和反向互补此类反向染色体的方法。
4.计算染色体共线性分化指数
Last updated