预测蛋白质二级结构的快速方法
预测蛋白质二级结构的快速方法
1 、 研究背景及意义
蛋白质二级结构的预测是生物、数学与计算机交叉领域的课题,进行二级结构预测对于理解蛋白
质结构与功能的关系,以及分子设计、生物制药等领域都有重要的现实。随着人类基因组计划的
顺利实施,已知氨基酸序列的蛋白质数量成级数增长,目前试验手段主要依靠 X射线晶体衍射与
核磁共振方法测定蛋白质二级结构,但测定周期较长,导致已测定二级结构的蛋白质数量与已知
氨基酸序列的蛋白质数量差距越来越大,要求有一种快速简洁而适用性强的预测蛋白质二级结构
的方法。而蛋白质的氨基酸排列顺序决定了它的空间结构,空间结构体现了蛋白质的生理功能,
那么就可以从已知序列和结构的蛋白质出发,挖掘出其中的关系,就可以预测出其他已知序列的
蛋白质的二级结构。如果准确率达到要求则对于了解生命现象的本质,解释疾病的发生机制,诊
断、治疗疾病、设计新药、通过不同生物蛋白质结构研究生物进化、利用其他生物为人类服务
等都有着非常重要的意义。综上,蛋白质结构的预测对于蛋白质的研究与应用领域具有很好的推
动作用。
2 、 预测方法
二级结构预测一直都是学者喜欢研究的问题,研究时间长,目前预测二级结构预测的方法已经有
很多,但是在准确率上都达不到所希望的要求,因此无数的人依然为此努力着(1)经验参数法。经
验参数法是一种基于单个氨基酸残基统计的经验预测方法。通过统计分析,获得的每个残基出现
于特定二级结构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构。1970 年
由Peter Y.Chou 和Gerald D.Fasman 提出 Chou-Fasman 方法是预测蛋白质二级结构的经验方
法。这种方法基于每个氨基酸在 α螺旋的相对频率,测试表,和通过 X射线晶体学已知的蛋白质
结构。从这些频率、概率参数,可知道每个氨基酸在各个二级结构类型的外观,而这些参数是用
来预测某一氨基酸序列将形成一个螺旋,一个测试链,或一个又一个蛋白质的概率的。该方法在
确定正确的二级结构准确性约 50-60%,这明显比现代机器学习技术的准确性要低。(2)GOR 方
法。
GOR 方法是一种基于信息论和贝叶斯统计学的方法,是统计算法中理论基础最好的。GOR 将蛋
白质序列当作一连串的信息值来处理,基本原理是将蛋白质的一级结构和二级结构看成一个转化
过程的两个相互联系的信息;GOR 方法不仅考虑被预测位置本身氨基酸残基种类的影响,而且考
虑相邻残基种类对该位置构象的影响。为了避免大量的实验数据,GOR 将信息函数分为多项式
和的形式。(3)Lim 方法-立体化学方法。氨基酸的理化性质对二级结构影响较大,在进行结构预
测时考虑氨基酸残基的物理化学性质。立体化学是从三维空间揭示分子的结构和性能。手性分
子是立体化学中极其重要的部分之一。同分异构在有机化学中是极为普遍的现象。立体异构是
指分子中的原子或基团在空间的排列不同步产生的异构现象。利用不同氨基酸家族的性质差异
来进行二级预测。(4)同源分析法。同源分析法是将待预测的片段与数据库中已知二级结构的片
段进行相似性比较,利用打分矩阵计算出相似性得分,根据相似性得分以及数据库中的构象态,构
建出待预测片段的二级结构。该方法对数据库中同源序列的存在非常敏感,若数据库中有相似性
大于 30%的序列,则预测准确率可大大上升。(5)BP 神经网络算法。在生物信息学研究中,应用得
最多的神经网络模型是多层前馈网络模型,这种模型使用最广泛的算法是 BP 算法,即反向传播算
法。它属于有导师学习的算法。这种模型也叫 BP 神经网络。网络通过对已有氨基酸编码建立
序列到结构,结构到结构的两层网络进行学习,预测的准确性上有极大的提高。
3 、 方法分析
蛋白质二级结构预测方法是首先预测蛋白质的结构类型,然后再预测二级结构。通过对各个方法
的比较可以得到:(1)与传统经典方法相比,利用特征信息提取方法可涵盖序列统计特征、氨基酸
物理化学特征、氨基酸片段位置分布三方面的信息,此方法可以较为全面地反映出蛋白质序列中
有代表性的特征信息。(2)通过采用有效的特征挑选算法以及分类算法,既有效减少了信息的冗
余,又提高了结构类预测模型的准确率。综上,本研究从信息学角度出发,系统地解决蛋白质信息
提取、多特征信息组合及结构类预测等信息处理问题,有助于蛋白质的结构及功能研究,同时也
标签: #结构
摘要:
展开>>
收起<<
预测蛋白质二级结构的快速方法1、研究背景及意义蛋白质二级结构的预测是生物、数学与计算机交叉领域的课题,进行二级结构预测对于理解蛋白质结构与功能的关系,以及分子设计、生物制药等领域都有重要的现实。随着人类基因组计划的顺利实施,已知氨基酸序列的蛋白质数量成级数增长,目前试验手段主要依靠X射线晶体衍射与核磁共振方法测定蛋白质二级结构,但测定周期较长,导致已测定二级结构的蛋白质数量与已知氨基酸序列的蛋白质数量差距越来越大,要求有一种快速简洁而适用性强的预测蛋白质二级结构的方法。而蛋白质的氨基酸排列顺序决定了它的空间结构,空间结构体现了蛋白质的生理功能,那么就可以从已知序列和结构的蛋白质出发,挖掘出其中...
相关推荐
-
2024年党建工作要点工作计划5篇供参考
2023-12-16 999+ -
2025年专题生活会对照带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”个人对照检查发言材料4110字文稿
2024-12-21 999+ -
2025年医保局局长、科技局领导干部专题“四个带头”方面对照检查材料2篇例文(附:反面典型案例剖析情况)
2025-02-09 457 -
2025年国有企业党委书记、市总工会党组书记民主生活会“四个带头”方面对照个人检查发言材料2篇文(附:典型案例、上年度整改+个人情况)
2025-02-09 506 -
2025年市委组织部部长、教育局党委书记生活会“四个带头”个人对照检查发言材料2篇文(典型案例+个人事项)
2025-02-09 626 -
2025年市财政局党组书记、局长、市检察院党组领导班子对照“四个带头”方面生活会个人对照检视发言材料2篇文(含以案为鉴反思、以案促改促治方面)
2025-02-09 508 -
市检察院党组、市财政局领导班子2025年生活会对照“四个带头”方面检视发言材料2份文【含以违纪行为为典型案例剖析】
2025-02-09 461 -
2025年市财政局领导对照“四个带头”生活会检视发言材料2篇例文【含以违纪行为为典型案例剖析】
2025-02-09 582 -
单位领导班子2025年聚焦“四个带头”生活会对照检查材料2篇文(含:典型案例剖析反思、落实意识形态责任制)
2025-02-09 757 -
2025年镇党委副书记、市科学技术局领导班子生活会对照“四个带头”检视材料2篇文【含违纪行为典型案例分析】
2025-02-09 257
作者:闻远设计
分类:社科文学类资料
价格:免费
属性:2 页
大小:13.48KB
格式:DOCX
时间:2024-04-23

