基于变分自编码器的空间转录组细胞聚类研究
空间转录组测序技术能够在生成基因表达谱的同时,保留细胞在组织内部的位置信息。如何充分利用基因表达谱和空间位置信息来识别空间区域,完成细胞亚群聚类是空间转录组学数据分析的基础和关键。 本文提出基于变分自编码器和图神经网络结合的空间转录组细胞亚群聚类方法。构建双层编码器结构,每一层包含简化图卷积(Simple Graph Convolution, SGC),用以生成低维表征。 解码器用以重构特征矩阵,通过最小化损失函数来提高低维表征质量。对低维表征进行下游聚类,生成不同的细胞亚群。 提出的聚类方法与多个基准方法在常用的空间转录数据集上进行比较,在聚类准确性和适应性方面都有优势,证明了提出方法的有效性。
- Python (>=3.8)
- Scanpy
- Squidpy
- Pytorch_pyG
- Pandas
- Numpy
- Sklearn
- Seaborn
- Matplotlib
- Torch_geometric
- Spatial clustering for human DLPFC data using VGAE_SGC method
running VGAE_SGC_training_example.ipynb to choose idetify the spatial domains for human breast cancner data
Benchmarking methods used in this paper include:
Distributed under the MIT License. See LICENSE.txt
for more information.
-
data files
Please down load the spatial transcriptomics data from the provided links. -
Porch_pyg
Please follow the instruction to install pyG and geometric packages.