01编辑效率检测

环境搭建

删除环境

conda remove -n py36 --all

安装环境

conda create -n py36 python=3.6

报错

  • ValueError: numpy.ufunc size changed, may indicate binary incompatibility. Expected 216 from C header, got 192 from PyObject

    原因是因为numpy版本太低了,卸载了安装旧的包;更新numpy包

    conda update numpy=1.16.1`

  • pkg_resources.DistributionNotFound: The 'kiwisolver>=1.0.1' distribution was not found and is required by matplotlib

    conda install kiwisolver=1.1.0

起步

  • 1.数据准备

    • 双端测序数据文件 R1.fastq R2.fastq

    • 引物文件,均为5到3方向,名称必须按照此格式TAB键分割

      A1-F  gcttGCGTtggagtgagtacggtgtgcAAAGTATGCCCCTTATGGACCCT
      A1-R  ctgtGCGTtgagttggatgctggatggTCCTCATCCCATTGTTCATTTCT
      # windows传进服务器会多一个\r字符,需要删除
      sed -i 's/\r//g' 文件名
    • 靶标文件和对应的sgRNA,TAB键分割

      A1    AAAGTATGCCCCTTATGGACCCTCTTGTGACATTATTTGGTAGTGTTCATGAAAAGCTTCCCGAGACAGGGAGCACGCGTAGTATGCTTTTTCCGAATTTTGGAAGCATGTTTAGTACAGCAGAGCCTCATGCTAGAAATGAACAATGGGATGAGGA AGACAGGGAGCACGCGTAGT  NA  NA
      # windows传瑾服务器会多一个\r字符,需要删除
      sed -i 's/\r//g' 文件名
      • 懒得打NA的情况

        # 输入文件格式
        A1    参考序列    sgRNA
        # 运行命令
        sed -i  's/$/\tNA\tNA/g'  靶标序列文件 
        # 命令直接对原文件进行了修改
        A1    参考序列    sgRNA    NA    NA
  • 2.合并双端测序数据

  • 3.反向互补R引物

  • 4.按barcode拆分reads

  • 5.按样品拆分扩增区域和靶标文件

  • 6.检测编辑情况

    vim barcode.lsf

    编写lsf作业,使用vim命令,将下面的代码复制到barcode.lsf文件中

    文件路径不能包含 ‘-’

  • 提交任务

    bsub <barcode.lsf`

输出结果文件目录

Last updated

Was this helpful?