01RNA-seq

样本编号

无纤维材料: 1、3

短纤维材料: 6、7

转化材料: J668

hisat2进行比对

版本:2.1.0

  • 比对质量大于30的read,认为是比对到基因组的唯一区域

Gh_indexfile='/data/cotton/zhenpingliu/genome/Hisat2Index/Ghirsutum_genome_HAU_v1.1/Ghirsutum_genome_HAU_v1'
all_fastq=`ls /public/home/zpliu/lib_family/saolei/F20FTSCCWLJ4479_LUDnktE/upload/Filter_SOAPnuke/Clean`
inputDir='/public/home/zpliu/lib_family/saolei/F20FTSCCWLJ4479_LUDnktE/upload/Filter_SOAPnuke/Clean'
outDir='/public/home/zpliu/lib_family/saolei/F20FTSCCWLJ4479_LUDnktE/upload/Filter_SOAPnuke/01hisat2'
for k in ${all_fastq[@]};
do
mkdir -p ${outDir}/${k}
hisat2 -x ${Gh_indexfile} -1 ${inputDir}/${k}/${k}_1.fq.gz -2 ${inputDir}/${k}/${k}_2.fq.gz  -p 10 --known-splicesite-infile  /data/cotton/zhenpingliu/genome/genome_data/Ghirsutum_genome_HAU_v1.1/hista_splice.txt  -S ${outDir}/${k}/${k}.sam && samtools view -q 30  -S ${outDir}/${k}/${k}.sam -@ 10 -b -o ${outDir}/${k}/${k}.bam && samtools sort -@ 10 ${outDir}/${k}/${k}.bam -O bam -o ${outDir}/${k}/${k}_sort.bam 
done

Stringtie计算基因的表达水平和转录本的组装

版本 :v2.1.4

转录本的merge

多个样本制作基因表达谱

使用pandas读取gene express 文件,合并不同样本的数据框得到表达谱

更加快速的方法,使用Ballgown,读取所有样本的Stringtie的输出文件夹,在使用

gene_expression=gexpr(bg)获取表达矩阵

提取novel junction

Last updated

Was this helpful?