Nature子刊|复旦大学乔亮等提出了用于从DIA数据中对完整的糖肽进行全蛋白质组表征的方法,或可成为糖蛋白组学研究的强有力工具

在糖蛋白组学中,对完整的糖肽进行大规模的分析是至关重要的,但也是具有挑战性的。数据独立采集是一项新兴技术,在蛋白质组学研究中具有深度的蛋白质组覆盖和精确的定量能力,但在糖蛋白组学领域仍处于早期发展阶段。该研究提出了GproDIA,一个将以肽为中心的DIA分析概念应用于完整的糖肽的全蛋白质组特征的管道。

在糖蛋白组学中,对完整的糖肽进行大规模的分析是至关重要的,但也是具有挑战性的。数据独立采集(DIA)是一项新兴技术,在蛋白质组学研究中具有深度的蛋白质组覆盖和精确的定量能力,但在糖蛋白组学领域仍处于早期发展阶段。

2021年10月18日,来自复旦大学乔亮等研究团队在Nature Communications上在线发表了题为“GproDIA enables data-independentacquisition glycoproteomics with comprehensive statistical control”的研究论文,提出了GproDIA,这是一个从DIA数据中对完整的糖肽进行全蛋白质组表征的框架,通过2-dimentional错误发现率方法和糖形推断算法进行全面的统计控制,使完整的糖肽在宽的分离窗口中得到准确的鉴定,这项工作能够为糖蛋白组学研究提供一个糖蛋白组学研究。

蛋白质糖基化是最丰富和异质的翻译后修饰(PTMs)之一,它提供了巨大的蛋白质组多样性,并在各种生物过程中发挥关键作用,甚至是正在进行的冠状病毒疾病2019年大流行的宿主-病原体互动。蛋白质糖基化的精确特征对于理解疾病的机制,发现诊断的生物标志物,以及药物和疫苗的开发至关重要。不同糖类的高度异质性导致糖蛋白形式的数量增加。完整的糖肽分析提供了在整个蛋白质组范围内同时分析糖、糖基占用和位点特异性糖基化的机会,是现代糖蛋白组学研究的一个必要但仍然具有挑战性的组成部分。

目前,液相色谱结合串联质谱(LC-MS/MS)是广泛用于蛋白质组学和糖蛋白组学的首选方法。由高能碰撞解离(HCD)和电子转移解离(ETD)衍生出的新的MS/MS片段分析方法,如阶梯式碰撞能量HCD(SCE-HCD)和补充HCD的ETD(ETThcD),已被证明对完整的糖肽分析具有强大的作用。最常见的糖肽分析策略是使用数据依赖性采集(DDA)方法,其中MS/MS(MS2)碎片是由全质量范围调查扫描(MS1)中观察到的前体离子引发的。各种软件工具,如Byonic、pGlyco、MSFragger-Glyco、MetaMorpheus等,已被开发用于解释完整糖肽的DDA数据。在pGlyco中,已经开发了全面的质量控制,对所有级别的糖类、肽类和糖肽的匹配进行错误率评估。然而,DDA方法的一个主要瓶颈是前体选择构成了一个随机因素,导致了"缺失值"问题。

为了克服这一局限性,人们提出了与数据无关的采集(DIA)方法,包括一个名为所有理论质谱的顺序窗口采集(SWATH-MS)的代表性变体,其中仪器以系统的方式在定义的隔离窗口内获取所有前体离子的碎片信息。据报道,DIA在大规模蛋白质组学研究中实现了深度的蛋白质组覆盖,并具有定量的一致性和准确性,现在开始应用于糖蛋白组学领域。

基于为蛋白质组学开发的标准DIA协议,Zacchi等人开发了完整糖肽的DIA分析,以测量酿酒酵母中八个N-糖基的糖基化模式。在他们的方案中,使用来自每个肽的非糖基化对应物的碎片离子和对应于各种聚糖的前体质量来生成糖肽的光谱库。Sanda等人报告了对人类血浆中完整的IgG糖型的检测,其中光谱库是通过添加人工策划的糖类片段Y离子建立的。Pan等人建立了一个包含多肽片段和糖类Y离子的光谱库,实现了对IgM中六个糖类的特异性N-糖基化分析。Zhou等人开发了一种SWATH-MS方法,对一组目标糖肽进行了优化的可变窗口,以实现精确的糖型测量。这些方法在定向分析几种或十几种糖蛋白的糖形态时,取得了比DDA更好的灵敏度。2019年,Ye等人提出Glyco-DIA,一种基于DIA的O-糖蛋白组学策略,能够在复杂的生物样品中进行高通量的O-GalNAc型糖蛋白组分析。

糖肽鉴定的错误率控制是至关重要的,但在DIA分析中特别复杂,因为DIA MS/MS光谱源于多个共同稀释的前体,特别是在使用宽隔离窗口时,其复杂性增加。在HCDMS/MS的情况下,相同的片段离子可以产生于肽序列相同但糖类不同的糖肽,从而导致DIA数据的高度误解。尽管一些研究已经阐明了基于DDA的糖肽分析的错误率估计,但基于DIA的全蛋白质组糖肽分析的统计控制还没有得到适当解决。

该研究提出了GproDIA,一个将以肽为中心的DIA分析概念应用于完整的糖肽的全蛋白质组特征的管道。GproDIA通过一个二维(2D)错误发现率(FDR)方法和一个糖形推断算法提供了全面的统计控制,能够使用宽的分离窗口进行准确的糖肽鉴定。进一步利用半经验谱系预测策略来扩大糖肽谱系库的覆盖范围。将GproDIA用于N-糖肽分析的基准是酵母样品的DIA数据,这些样品只包含高甘露糖类型的糖类,以及人血清样品,其糖类的复杂性更高。结果表明,使用GproDIA的DIA在识别能力和数据完整性以及定量的准确性和精确性方面都优于DDA。

参考文献:

https://www.nature.com/articles/s41467-021-26246-3

随便看看别的百科