Nature,|,我们可能不知道我们的细胞里有一半是什么,人工智能技术揭示了以前未知的细胞成分

大多数人类疾病都可以追溯到细胞中功能失调的部分--肿瘤之所以能够生长,是因为一个基因没有被准确地转化成一种特定的蛋白质,或者一种代谢性疾病的产生是因为线粒体没有正常运转,例如。在一个例子中,研究人员发现一组蛋白质形成了一个不熟悉的结构。

大多数人类疾病都可以追溯到细胞中功能失调的部分--肿瘤之所以能够生长,是因为一个基因没有被准确地转化成一种特定的蛋白质,或者一种代谢性疾病的产生是因为线粒体没有正常运转,例如。但是为了了解细胞在疾病中哪些部分会出错,科学家首先需要有完整的部件清单。

11月24日,来自加州大学旧金山分校的研究人员在Nature上在线发表了题为“A multi-scale map of cell structure fusing protein images and interactions”的研究论文,将人类蛋白质图谱中的免疫荧光图像与BioPlex中的亲和纯化结合起来,创建一个统一的人类细胞结构的层次图,赋予蛋白质相互作用一个空间维度,为将不同类型的数据纳入全蛋白质组细胞图谱铺平了道路。

真核细胞由大型部件组成,如细胞器,它们递归成更小的部件,如凝结物和蛋白质复合物,形成了复杂的多尺度结构。绘制亚细胞结构图的基本技术是蛋白质成像和生物物理关联,其中每一项都已经广泛地实现了自动化。特别是共聚焦显微镜和免疫荧光技术的进步,使得扫描单细胞内蛋白质的原位分布成为可能。通过将这些技术与抗体库相结合,人类蛋白质图谱(HPA)已经开始了系统的研究,将人类蛋白质定位到亚细胞区室中。作为一种平行于细胞图谱的方法,质谱(MS)已经与亲和纯化(AP-MS)和接近依赖性标记有力地结合起来,以实现蛋白质-蛋白质关联的快速测量。利用AP-MS,BioPlex项目正在生成大多数人类蛋白质的综合相互作用图。

鉴于这些努力,一个关键问题是如何将成像和生物物理关联结合起来为细胞结构提供信息。研究人员推断,这两个平台提供了蛋白质位置的补充措施,尽管其特征大不相同。图像将蛋白质与细胞地标(如细胞核)相对应,而生物物理关联将蛋白质与附近的蛋白质相对应。在这两种情况下,这种定位已经变得越来越量化,部分原因是机器学习系统识别数据中复杂模式的能力。

该研究展示了一种机器学习方法,其中蛋白质成像和生物物理关联被整合到一起,以创建一个统一的亚细胞组件地图。首先,使用神经网络在成像或生物物理关联的基础上将蛋白质投射到少量的维度。一旦每个平台的蛋白质坐标被确定,蛋白质之间的成对距离被校准并结合起来,以揭示不同尺度的组合,从非常小(小于50纳米)到非常大(超过1微米)。

研究人员揭示了人类肾脏细胞系中含有大约70个成分,其中一半从未见过。在一个例子中,研究人员发现一组蛋白质形成了一个不熟悉的结构。他们与加州大学圣迭戈分校的同事合作,最终确定了这种结构是一种新的结合RNA的蛋白质复合物。这种复合物很可能参与剪接,这是一种重要的细胞事件,可以将基因转化为蛋白质,并帮助确定哪些基因在什么时候被激活。

参考文献:

http://dx.doi.org/10.1038/s41586-021-04115-9

随便看看别的百科