/Bioinformatics_VGAE_SGC

基于变分自编码器的空间转录组细胞聚类研究

Primary LanguageJupyter Notebook

Bioinformatics_VGAE_SGC

基于变分自编码器的空间转录组细胞聚类研究


空间转录组测序技术能够在生成基因表达谱的同时,保留细胞在组织内部的位置信息。如何充分利用基因表达谱和空间位置信息来识别空间区域,完成细胞亚群聚类是空间转录组学数据分析的基础和关键。 本文提出基于变分自编码器和图神经网络结合的空间转录组细胞亚群聚类方法。构建双层编码器结构,每一层包含简化图卷积(Simple Graph Convolution, SGC),用以生成低维表征。 解码器用以重构特征矩阵,通过最小化损失函数来提高低维表征质量。对低维表征进行下游聚类,生成不同的细胞亚群。 提出的聚类方法与多个基准方法在常用的空间转录数据集上进行比较,在聚类准确性和适应性方面都有优势,证明了提出方法的有效性。

Workflow of spatial clustering task

Contents

Prerequisites

  1. Python (>=3.8)
  2. Scanpy
  3. Squidpy
  4. Pytorch_pyG
  5. Pandas
  6. Numpy
  7. Sklearn
  8. Seaborn
  9. Matplotlib
  10. Torch_geometric

(back to top)

Example usage

  • Spatial clustering for human DLPFC data using VGAE_SGC method
      running VGAE_SGC_training_example.ipynb to choose idetify the spatial domains for human breast cancner data

(back to top)

Benchmarking methods

Benchmarking methods used in this paper include:

(back to top)

Datasets Availability

(back to top)

License

Distributed under the MIT License. See LICENSE.txt for more information.

(back to top)

Trouble shooting

  • data files
    Please down load the spatial transcriptomics data from the provided links.

  • Porch_pyg
    Please follow the instruction to install pyG and geometric packages.