Nature子刊,|西交利物浦大学孟佳等提出了一种从RNA序列综合预测和解释转录后RNA修饰的方法

最近的研究表明,通过转录后的RNA修饰进行外转录组调控对所有的RNA类型都至关重要。精确识别RNA修饰位点对于理解RNA的功能和调节机制至关重要。转录后的RNA修饰增加了RNA分子的结构和功能多样性,并调节RNA生命的各个阶段。该研究提出MultiRM,一种基于注意力的多标签神经网络方法,用于综合预测和解释来自初级RNA序列的RNA修饰。

来源:iNature Life(ID:iNature_Lifes)

最近的研究表明,通过转录后的RNA修饰进行外转录组调控对所有的RNA类型都至关重要。精确识别RNA修饰位点对于理解RNA的功能和调节机制至关重要。

2021年6月29日,来自西交利物浦大学孟佳和Daiyun Huang等研究团队在Nature Communications上在线发表了题为“Attention-based multi-label neuralnetworks for integrated prediction and interpretation of twelve widelyoccurring RNA modifications”的研究论文,提出了MultiRM,一种从RNA序列综合预测和解释转录后RNA修饰的方法。

转录后的RNA修饰增加了RNA分子的结构和功能多样性,并调节RNA生命的各个阶段。因此,精确识别RNA修饰位点对了解各种RNA的功能和调节机制至关重要。超过100种不同类型的RNA修饰已被确认,其中,N6-甲基腺苷(m6A)是最常见的真核生物mRNA修饰。

M6A发生在新生的前mRNA上,调节其稳定性和翻译。它参与了许多生物过程,如昼夜节律钟、从幼稚的多能性分化和热冲击反应。它还在疾病发病机制中发挥各种作用,如癌、乳腺肿瘤、胃癌和抗肿瘤免疫。除了m6A,还有一些具有关键生物功能的RNA修饰。例如,N1-甲基腺苷(m1A)可以阻断Watson-Crick界面,对tRNA的稳定性和HIV-1的复制至关重要。

到目前为止,已经提出了许多计算方法,从初级RNA序列中进行RNA修饰位点的预测,包括:iRNA toolkits, SRAMP, DeepPromise, WHISTLE, Gene2vec, m6A-Atlas,RMDisease, PEA, PPUS, BERMP, m5Upred, and m6AmPred。人们还特别关注预测内含子、lncRNAs以及各种组织和细胞系中的RNA修饰情况。总之,这些工作大大促进了对不同物种在不同条件下多种RNA修饰类型的定位的理解。

然而,现有的方法受到以下限制。首先,大多数现有的研究只关注单一的RNA修饰类型,主要是m6A,但未能通过一个综合预测模型同时支持多种RNA修饰。其次,大多数现有的工作依赖于来自单一来源(单一数据库或由单一实验产生的数据集)的有限数据,未能充分利用现有的外显转录组信息。第三,该领域的大多数工作,如SRAMP12和iMRM29,侧重于预测的准确性,但未能对其预测结果提供明确和直观的解释。最后,对于一些RNA修饰类型,如m6Am,还没有开发出一个预测框架。

该研究提出MultiRM,一种基于注意力的多标签神经网络方法,用于综合预测和解释来自初级RNA序列(或相应DNA序列)的RNA修饰。支持12种RNA修饰类型,包括m6A、m1A、m5C、m5U、m6Am、m7G、Ψ、I、Am、Cm、Gm和Um。这些是唯一广泛发生的RNA修饰,可以用现有的碱基分辨率技术对整个转录体进行分析,这也是可靠的大规模预测所需要的RNA修饰特性。该方法的多标签结构能够适应不同修饰的共同结构,同时充分利用它们的不同特征。一些被广泛采用的最先进的机器学习算法XGBoost和CatBoost作为基准实现。重要的是,使用了综合梯度(IG)和注意力权重来深入了解训练后的整体模型,并解释每一个单独的预测。最后,开发了一个网络服务器,并免费提供给研究界使用。

总之,该研究为检测多种RNA修饰提供了一个解决方案,使这些RNA修饰的综合分析成为可能,并对基于序列的RNA修饰机制有了更好的理解。

参考文献:

https://www.nature.com/articles/s41467-021-24313-3#Abs1

本文版权归原作者所有,文章内容不代表平台观点或立场。如有关于文章内容、版权或其他问题请与我方联系,我方将在核实情况后对相关内容做删除或保留处理!

随便看看别的百科