Nature子刊|东南大学陆祖宏等开发了一种可用于识别和描述特定个体的全基因组G4s的方法

在单链RNA序列中也发现了G4s。G4结构被认为是结状结构,已被证明在体外接近生理条件下稳定形成。G4结构被阳离子所稳定,根据以下顺序偏向于单价阳离子的稳定。基因组中G4结构的形成可以影响染色质结构和许多基本的生物过程,如DNA复制和基因调节。识别全基因组或全转录组的G4将加速对这些结构的形成、稳定性和功能的研究。

2021年10月14日,来自东南大学陆祖宏等研究团队在Nature Communications上在线发表了题为“Direct genome-wide identification of G-quadruplex structures by whole-genome resequencing”的研究论文,提出了一种全基因组DNA G-四联体(G4)分析方法,该方法通过抓住测序质量的轻微波动,从普通的全基因组重测数据中识别G4结构,所给的方法可用于识别和描述特定个体的全基因组G4s。

G-四联体(G4)结构是B型DNA双螺旋结构的另一种构象,产生于富含鸟嘌呤的序列。在单链RNA序列中也发现了G4s。一个四链G4是由两个或更多的平面G-tetrads堆积而成,一个G-tetrad通过四个鸟嘌呤的Hoogsteen氢键形成。G4结构被认为是结状结构,已被证明在体外接近生理条件下稳定形成。G4结构被阳离子所稳定,根据以下顺序偏向于单价阳离子的稳定。基因组中G4结构的形成可以影响染色质结构和许多基本的生物过程,如DNA复制和基因调节。识别全基因组或全转录组的G4将加速对这些结构的形成、稳定性和功能的研究。

在过去的十年中,已经开发了几种方法来识别全基因组或全转录组的G4,包括计算序列分析和实验。通过搜索简单的共识序列或容纳结构变体,计算工具已经帮助识别特定基因组中潜在的G4。计算预测采用的算法来自于少量序列的实验数据,需要彻底的实验验证。使用染色质免疫沉淀后的高通量测序(G4 ChIP-seq),可以检测DNA G4s并将其映射到基因组中。在这些方法中,针对已知G4结合蛋白的抗体被用来推断G4s。值得注意的是,G4 ChIP-seq依赖于特定的抗体,可能会引入潜在的偏差。DNA中折叠的G4的存在会使DNA聚合酶停滞。结合高通量测序(G4-seq),根据全基因组的DNA聚合酶停止试验,确定了超过70万个DNA G4位点。在G4-seq中,每个DNA模板被测序两次。

最初的测序运行使用不稳定G4的单价阳离子Na+,以确保准确的测序,第二次测序运行是在G4稳定的条件下进行的。通过基于第一次测序运行结果的错配定量,在体外检测到折叠的G4s在整个基因组中。同样,使用逆转录酶滞后(rG4-seq)高通量地检测了RNA G4结构。G4-seq是一种快速和强大的方法来识别基因组中的G4位点,其中包括各种难以预测的非经典G4结构。G4-seq的优化版本已被用于生成12个物种的全基因组G4图。然而,G4-seq取决于测序缓冲器的容纳量,这对大多数研究人员来说是无法达到的。两次测序运行也意味着双重成本。如果G4结构能从标准的高通量测序数据中直接剖析出来,那么该程序将更加方便用户和具有成本效益。

该研究提出了G4-miner,一种从标准测序数据中直接识别G4结构的全基因组方法。G4-miner检查了整个基因组的测序质量,抓住了局部的意外波动,并将一些质量波动归结为G4的不稳定形成。在标准Illumina测序条件下对原发性人类B淋巴细胞的DNA进行了测序。虽然标准的Illumina测序缓冲液不会引起强烈的G4稳定化,但从G4结构开始,测序质量出现了轻微的、不稳定的下降。将人类基因组中的MG4位点,与计算预测和优化G4-seq的结果进行了评估,并利用查获的G4位点评估了单核苷酸变异(SNVs)在G4形成中的影响。给出的方法为识别全基因组的G4结构提供了一个方法。

参考消息:

https://www.nature.com/articles/s41467-021-26312-w

随便看看别的百科