首页    数据分析    生信干货:空间转录组结合病理切片的上游定量流程(spaceranger)

生信干货:空间转录组结合病理切片的上游定量流程(spaceranger)

创建时间:2024-07-10 10:52

        Spaceranger是由10x Genomics公司开发的一套软件工具,专为处理其空间转录组平台生成的数据而设计。它包括从原始数据到最终结果的完整分析流程。今天,我们将带您重现从下载软件开始的走Spaceranger的定量流程。让你在科研路上更加得心应手!

空间转录组测序流程和软件工具的分析示意图如下:

值得一提的是,Spaceranger允许用户在福尔马林固定石蜡包埋(FFPE)和新鲜冷冻组织(FF)中进行全转录组映射。它可以接受用苏木精和伊红(H&E)染色的明场图像、单/多灰度荧光通道图像,及由外部程序(如Photoshop)组合和着色的荧光通道图像所制成的彩色图像作为输入。

另外,不同的组织保存方式FF和FFPE的数据分析流程不同,H&E图片和荧光图片分析流程不同,因此需要参考10X官网的pipeline。

现在,我们可以开始走代码流程了~

1. spaceranger软件下载

# download
curl -o spaceranger-3.0.0.tar.gz "https://cf.10xgenomics.com/releases/spatial-exp/spaceranger-3.0.0.tar.gz?Expires=1715196059&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=l4R4HZN1RsXuNBORyXXCzOIyxIuGgKzgyTwSxIP~5PHFLQ4kTUQaRVMohC7wnEg4~vnbtXRTGqV3RfpoZAOZSsv7m-kxEnc5xI~4nDp7UVGwmsT8KwynMAyy2RUnuKX4~F8agqXGrKpKRyKSwT~nI6WE6EAASzE4iPQ-WipFUzKnUB0LJi0FxMqi~~7qKGtu6b-A~QnmO1027BfubWSEbz0UmLnyxQyiMPyHFTYHu1f35LdbVM~l6cinFesctwkjzZURyAMZyKzWsXwArjpbZbeeIVUvqcoA3YnP2BcaCuk-MikrRGJSDAusyei87iiyzcNT4ykRfzDHCsi43Yys~Q__"
# unzip
tar -xzvf spaceranger-3.0.0.tar.gz
# add to environmental path
echo "export PATH=/Users/wangjun/spaceranger-3.0.0:$PATH" >> ~/.zshrc && source ~/.zshrc
# 验证是否成功安装
spaceranger testrun --id=tiny

2. 数据导入

2.1 导入空转示例数据文件(raw data):

# 前列腺癌(prostate cancer)空间转录组示例数据
curl -O https://cf.10xgenomics.com/samples/spatial-exp/1.3.0/Visium_FFPE_Human_Prostate_Acinar_Cell_Carcinoma/Visium_FFPE_Human_Prostate_Acinar_Cell_Carcinoma_fastqs.tar
curl -O https://cf.10xgenomics.com/samples/spatial-exp/1.3.0/Visium_FFPE_Human_Prostate_Acinar_Cell_Carcinoma/Visium_FFPE_Human_Prostate_Acinar_Cell_Carcinoma_image.tif
curl -O https://cf.10xgenomics.com/samples/spatial-exp/1.3.0/Visium_FFPE_Human_Prostate_Acinar_Cell_Carcinoma/Visium_FFPE_Human_Prostate_Acinar_Cell_Carcinoma_probe_set.csv

2.2. 下载参考数据集(reference)并解压

参考数据集是运行spaceranger count pipeline所必需的,下面我们下载参考数据集。

# human reference (GRCh38): 10.6G
curl -O "https://cf.10xgenomics.com/supp/spatial-exp/refdata-gex-GRCh38-2020-A.tar.gz"
tar -xzvf refdata-gex-GRCh38-2020-A.tar.gz
  • output:

3. spaceranger count上游定量分析

有了原始fastq测序数据及参考基因组索引文件,可以用count命令对单样本进行spot和基因进行定量,定量结果储存在features,barcodes和matrix三个文件里。

其中,spaceranger count从spaceranger mkfastq中获取明场切片图像和FASTQ文件,并执行对齐,组织检测,基准检测和条形码/UMI计数等步骤后转为spot X gene的表达矩阵。该管道使用Visium空间条形码的寡核苷酸生成特征点矩阵feature-spot matrices,确定聚类并执行基因表达分析。

  •  spaceranger count运行时图片对齐有两种方式,一种软件自动识别图片进行对齐。另外一种就是先用Loupe软件手动对齐,生成对于json文件提供给后面的软件并用loupe-alignment参数指定。

  • 在UMI计数步骤中,spaceranger将前面产生的fastq测序数据比对到参考基因组上,进行基因表达的定量。

data_path=/Users/wangjun/Desktop/Jun_script/jupyter_base/spatial_transcriptome
transcriptome=~/software_installed/spaceranger-1.3.1/genome/refdata-gex-GRCh38-2020-A

spaceranger count --id=PC1 # 输出文件夹的名字\
                   --transcriptome=$transcriptome \
                   --probe-set=${data_path}/Prostate/Visium_FFPE_Human_Prostate_Acinar_Cell_Carcinoma_probe_set.csv 
                   --fastqs=${data_path}/Prostate/Visium_FFPE_Human_Prostate_Acinar_Cell_Carcinoma_fastqs 
                   --sample=Prostate # 要和fastq文件命名一致\
                   --image=${data_path}/Prostate/Visium_FFPE_Human_Prostate_Acinar_Cell_Carcinoma_image.tif 
                   --slide=V11J26-002 # 和实验相关参数\
                   --area=B1 # 和实验相关参数\
                   --localcores=16 # 多少个多线程\
                   --localmem=128 # memory 128G
# --loupe-alignment   由手动Loupe对齐步骤生成的对齐文件。在这种情况下,必须提供--image。                                    

请关注微信公众号,更多精彩内容实时更新中

 

                                                               

 


本网站发布所有原创内容,版权归属尖端生物及相关版权方,内容仅供学术交流,如有侵权请联系删除。未经授权的转载是侵权行为,版权方保留追究法律责任的权利。投稿,转载或版权问题,请联系:submit@advanced-biotech.cn;商务合作请联系:cc@advanced-biotech.cn

 

 

热点资讯