Analysis 结果
:statue_of_liberty:count aggr reanalysis三个脚本的分析的CSV结果文件,被用来渲染Summary HTML。
1. 降维
在进行聚类之前,使用标准化后的feature-barcode矩阵进行PCA分析,来减少feature(gene)的数目,只有表达了的基因才会被用来进行PCA分析
第一步就是将每个细胞投影到N个组成份,默认N=10,使用reanalyze可以认为的定义这个N
总共含有四个输出文件
project 投影文件
每个barcode,也就是每个细胞在每个维度上的投影值
Barcode,PC-1,PC-2,PC-3,PC-4,PC-5,PC-6,PC-7,PC-8,PC-9,PC-10 AAACATACAACGAA1,-0.2765,-5.7056,6.5324,-12.2736,-1.4390,-1.1656,-0.1754,-2.9748,3.3785,1.6539
component** 贡献文件
每个基因对每个组分的贡献
PC,ENSG00000228327,ENSG00000237491,ENSG00000177757,ENSG00000225880,...,ENSG00000160310 1,-0.0044,0.0039,-0.0024,-0.0016,...,-0.0104
variance 变异解释比例
例如将每个细胞在每个组成份中计算一个值,就是对应的坐标值,根据这个值来将数据进行重构,看是否能够代表原始数据;当变异解释读趋于平缓时u,增加PCA的数目不能够解释样本中的总变异
随着主成分数目的增加,能够解释的变异程度也会减少
PC,Proportion.Variance.Explained 1,0.0056404970744118104 2,0.0038897311237809061 3,0.0028803714818085419 4,0.0020830581822081206
dispersion标准化文件
记录了每个基因标准化后的表达水平
2. t-SEN
t-distributed Stochastic Neighbor Embedding (t-SNE) 用来将每个细胞映射到2维空间
3. Cluster
将具有相同表达模式的细胞进行聚类,聚类的方式有两种
基于图形进行聚类 Graph-based clustering
基于PCA的结果进行聚类
4. Differential Expression
根据Barcode将每个细胞进行聚类
Last updated
Was this helpful?