Analysis 结果
:statue_of_liberty:count aggr reanalysis三个脚本的分析的CSV结果文件,被用来渲染Summary HTML。
1. 降维
在进行聚类之前,使用标准化后的feature-barcode矩阵进行PCA分析,来减少feature(gene)的数目,只有表达了的基因才会被用来进行PCA分析
第一步就是将每个细胞投影到N个组成份,默认N=10,使用reanalyze可以认为的定义这个N
总共含有四个输出文件
project 投影文件
每个barcode,也就是每个细胞在每个维度上的投影值
component** 贡献文件
每个基因对每个组分的贡献
variance 变异解释比例
例如将每个细胞在每个组成份中计算一个值,就是对应的坐标值,根据这个值来将数据进行重构,看是否能够代表原始数据;当变异解释读趋于平缓时u,增加PCA的数目不能够解释样本中的总变异
随着主成分数目的增加,能够解释的变异程度也会减少
dispersion标准化文件
记录了每个基因标准化后的表达水平
2. t-SEN
t-distributed Stochastic Neighbor Embedding (t-SNE) 用来将每个细胞映射到2维空间
3. Cluster
将具有相同表达模式的细胞进行聚类,聚类的方式有两种
基于图形进行聚类 Graph-based clustering
基于PCA的结果进行聚类
4. Differential Expression
根据Barcode将每个细胞进行聚类
Last updated