我区科研团队在蛋白质生物信息学研究领域取得最新进展
发布时间:2022-06-08 15:19 来源:内蒙古亚洲博彩平台排名基础研究处
蛋白质是细胞及整个生物体的遗传特性的直接体现者,蛋白质结构人工智能(AI)预测工具AlphaFold的发布解决了生物学领域50年来的重大科学挑战。近日,内蒙古大学左永春教授科研团队在蛋白质序列、结构和功能分析的生物信息学领域取得最新科研成果,相关论文近日刊登于国际知名学术期刊《核酸研究》(Nucleic Acids Research)(影响因子16.971),Nucleic Acids Research杂志由国际著名出版商Oxford University Press出版,关注涉及核酸代谢和相互作用中涉及的核酸和蛋白质的物理、化学、生化和生物学方面的研究,在国际核酸/蛋白质及生物信息学研究领域具有权威影响力。
该研究得到国家自然科学基金(62061034, 62171241, 61861036, 62161039)、内蒙古自然科学基金杰出青年培育基金(2017JQ04)、内蒙古关键技术攻关项目(2021GG0398)以及内蒙古青年科技英才(NJYT-18-B01)等项目的支持。
AI工具大大加快了人类健康监测、精准医学及新药研发进程,也为草原家畜等大动物的蛋白质结构预测和功能解析研究提供了新的前沿技术。相对于其它生物大分子,蛋白质分析具有更大的复杂性,对于计算生物学家来说,这常常会影响计算效率,增加信息冗余与过度拟合的机会。对于实验生物学家来说,这通常会影响蛋白质功能的解释、相互作用和生物学注释等。为了最小化上述弊端的影响,理论上可以将具有相似生化性质和频率分布的20种天然氨基酸组成的字母表压缩为由更少氨基酸类别组成的约化氨基酸字母表,进而简化蛋白质序列和结构分析,这促使科研团队基于该理论研发出蛋白质分析平台RaacFold。
RaacFold利用 58 种约化方法及算法提取的 687 个约化氨基酸字母表,研发出三种分析工具:ProteinAnalysis、AlignAnalysis和MultiAnalysis。ProteinAnalysis和AlignAnalysis提供具有相似特性和简化特征的序列和结构,有助于更清晰地识别分散在蛋白质结构中的功能区域,以获取关键特征信息。进而简化人工蛋白的设计,避免冗余信息。此外,MultiAnalysis允许用户探索蛋白质结构和功能进化中的生物物理变异和保守性,进而为识别和探索旁系同源物的非同源功能提供了重要信息。在RaacFold交互界面中,支持用户对序列、结构、功能注释的实时编辑,渲染和导出。该平台提供四种视图模式:天然编码模式、约化编码模式、进化保守度模式、预测可信度模式。为了创建直观的蛋白质结构视觉效果,RaacFold提供强大的 2D 和 3D 渲染性能,支持阴影、轮廓、粗糙度等细节渲染参数调节。同时支持不同的蛋白质结构显示层面,包括表面和体积(分子表面、高斯体积等)、二级结构(卡通、带状等)和原子(球棒、空间填充等)。
RaacFold很好地解决了AI处理蛋白质序列、结构和功能分析中存在的特征维度高和冗余性问题,在降低蛋白质复杂性和捕获隐藏在噪声信号中的保守特征方面表现出众。对于计算和实验生物学家来说,它有可能成为蛋白质分析的一个重要组成部分,包括同源性检测、进化推理和功能预测。通过该平台可以为蛋白质作用机制等研究提供前瞻性理论,为发育进化等方面研究提供有力的指导作用,为蛋白质设计提供高效的分析平台。
此次发表的最新成果之前,左永春教授科研团队已搭建了蛋白质序列氨基酸约化分析与特征提取平台PseKRAAC (Bioinformatics. 2017; ESI 1% 全球高被引论文)、蛋白质氨基酸约化数据库RaacBook (Database, 2019; 软著登记号2019SR0467812)、蛋白质序列功能域的可视化分析平台RaacLogo(Briefings in Bioinformatics. 2021; ESI 1% 全球高被引论文)。
论文链接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac399/6593113