Nature子刊,|上海交通大学俞章盛等开发了一种轻量级的算法GapClust以检测稀有细胞类型

单细胞RNA测序是详细描述复杂组织内细胞状况的有力工具。大规模的单细胞转录组学为识别在发育和疾病中发挥关键作用的稀有细胞提供了机会和挑战。为了克服这些限制,开发了一个轻量级的工具,GapClust,它在搜索稀有细胞时实现了准确性和效率的平衡。肠道和68kPBMC数据集的应用显示了GapClust在稀有细胞类型识别方面的能力。

来源:iNature Life(ID:iNature_Lifes)

单细胞RNA测序(scRNA-seq)是详细描述复杂组织内细胞状况的有力工具。大规模的单细胞转录组学为识别在发育和疾病中发挥关键作用的稀有细胞提供了机会和挑战。

2021年7月7日,来自上海交通大学俞章盛等研究团队在Nature Communications上在线发表了题为“GapClust is a light-weight approachdistinguishing rare cells from voluminous single cell expression profiles”的研究论文,开发了GapClust,一个轻量级的算法,以最先进的速度和记忆效率从超大规模的scRNA-seq数据集中检测稀有细胞类型。

单细胞RNA测序(scRNA-seq)技术的引入大大促进了单细胞分辨率的生物医学研究,这是剖析健康和疾病中复杂组织内细胞异质性的必要条件。随着产量和效率的不断提高,scRNA-seq数据集包括了超过一百万个细胞的转录图谱,已经被贡献出来。其中主要的细胞类型可以通过Seurat和Scater等工具箱进行全面的表征,而占新细胞类型大多数的稀有细胞类型仍有待于通过专门的方法进行发掘。

此外,有证据表明,稀有细胞群,包括循环肿瘤细胞、内皮祖细胞和抗原特异性T细胞,在癌症和其他疾病的致病机制、血管生成和免疫反应调解中发挥着重要作用。随着先进技术分析的细胞数量越来越多,更多的稀有细胞类型可以被采样,为新的细胞类型鉴定带来了机遇和挑战。

经过广泛的调查,有几种罕见的细胞类型检测算法,其中最突出的是RaceID,GiniClust,CellSIUS和FiRE。RaceID从无监督聚类的迭代步骤中获取信息,以巨大的计算成本为代价确定丰富的细胞类型,从而发现离群细胞。GiniClust采用更直接的策略,通过应用基于密度的聚类,确定稀有细胞类型,这些基因只在稀有细胞群中表达,因此显示出高基尼指数值。

CellSIUS利用已建立的主要细胞类型来筛选标记基因,这些标记基因的表达在每个簇内呈现出双峰分布,然后将这些基因聚集起来进行一维聚类,以确定簇的特定亚群。FiRE采用高效的Sketching技术,为每个细胞分配一个多次的哈希代码,并使用哈希代码的流行程度作为其驻留细胞的稀有程度的指标。与其他三种离散分层的方法相比,FiRE给每个细胞分配一个连续的分数,分数高于阈值的细胞被确定为稀有细胞。此外,EGDE,一种对scRNA-seq数据进行降维和特征基因提取的新方法,可以检测到稀有细胞群。

值得注意的是,上面的算法可以根据数据集的特点来使用。在越来越多的情况下,包含数千个细胞的scRNA-seq数据集由于运行时间的不现实量而排除使用RaceID,而GiniClust,据报道在处理超过45,000个细胞的表达数据时失败。此外,基于液滴的协议已经实现了数万个单细胞的平行分析,由于大大降低了每个细胞的成本而被广泛使用。CellSIUS只能应用于确定了主要细胞类型的数据集,错误分类的集群信息将大大影响其功效。FiRE在处理大型scRNA-seq数据集方面更强大,但不能区分离群细胞和代表次要细胞类型的细胞,因此要依靠下游分析来标记离群细胞和识别次要细胞集群。直观地说,EDGE可以提供scRNA-seq数据集的二维嵌入,以显示稀有细胞类型。然而,稀有细胞类型的确切指数需要通过分析来确定。

为了克服这些限制,开发了一个轻量级的工具,GapClust,它在搜索稀有细胞时实现了准确性和效率的平衡。GapClust的设计灵感来自于这样的观察:对于一个大小为n的小聚类Cn中的特定数据点,那么由于Cn和其相邻聚类之间的差距,它与Cn外的最近邻居的距离远远大于与Cn内邻居的距离。

研究人员提出了一个捕捉距离变化的二阶导数型距离得分,以充分利用这种差距信息。通过基于多个scRNA-seq数据集的多样化模拟实验,证明了GapClust在稀有细胞检测方面的精度和灵敏度都优于现有方法。更重要的是,卓越的速度和记忆效率使GapClust能够轻松地处理庞大的scRNA-seq数据集。肠道和68k PBMC数据集的应用显示了GapClust在稀有细胞类型识别方面的能力。

参考文献:

https://www.nature.com/articles/s41467-021-24489-8#Abs1

本文版权归原作者所有,文章内容不代表平台观点或立场。如有关于文章内容、版权或其他问题请与我方联系,我方将在核实情况后对相关内容做删除或保留处理!

随便看看别的百科