01RNA-seq
样本编号
无纤维材料: 1、3
短纤维材料: 6、7
转化材料: J668
hisat2进行比对
版本:2.1.0
比对质量大于30的read,认为是比对到基因组的唯一区域
Gh_indexfile='/data/cotton/zhenpingliu/genome/Hisat2Index/Ghirsutum_genome_HAU_v1.1/Ghirsutum_genome_HAU_v1'
all_fastq=`ls /public/home/zpliu/lib_family/saolei/F20FTSCCWLJ4479_LUDnktE/upload/Filter_SOAPnuke/Clean`
inputDir='/public/home/zpliu/lib_family/saolei/F20FTSCCWLJ4479_LUDnktE/upload/Filter_SOAPnuke/Clean'
outDir='/public/home/zpliu/lib_family/saolei/F20FTSCCWLJ4479_LUDnktE/upload/Filter_SOAPnuke/01hisat2'
for k in ${all_fastq[@]};
do
mkdir -p ${outDir}/${k}
hisat2 -x ${Gh_indexfile} -1 ${inputDir}/${k}/${k}_1.fq.gz -2 ${inputDir}/${k}/${k}_2.fq.gz -p 10 --known-splicesite-infile /data/cotton/zhenpingliu/genome/genome_data/Ghirsutum_genome_HAU_v1.1/hista_splice.txt -S ${outDir}/${k}/${k}.sam && samtools view -q 30 -S ${outDir}/${k}/${k}.sam -@ 10 -b -o ${outDir}/${k}/${k}.bam && samtools sort -@ 10 ${outDir}/${k}/${k}.bam -O bam -o ${outDir}/${k}/${k}_sort.bam
doneStringtie计算基因的表达水平和转录本的组装
版本 :v2.1.4
转录本的merge
多个样本制作基因表达谱
使用pandas读取gene express 文件,合并不同样本的数据框得到表达谱
更加快速的方法,使用Ballgown,读取所有样本的Stringtie的输出文件夹,在使用
gene_expression=gexpr(bg)获取表达矩阵
提取novel junction
Last updated
Was this helpful?