蛋白质二级结构的预测以及二级结构与三级结构之间关联的探讨

蛋白质二级结构的预测以及二级结构与三级结构之间关联的探讨蛋白质的生物功能以其结构为基础。随着人类基因组计划的顺利实施,蛋白质序列信息的积累速度远快于蛋白质结构数量的增长速度。实验上研究蛋白质结构的主要

蛋白质二级结构的预测以及二级结构与三级结构之间关联的探 讨 蛋白质的生物功能以其结构为基础。随着人类基因组计划的顺利实施,蛋白 质序列信息的积累速度远快于蛋白质结构数量的增长速度。 实验上研究蛋白质结构的主要手段有X射线晶体学技术、核磁共振衍射技 术、电子纤维技术等。然而,通过实验手段确定蛋白质的结构,不但成本高、耗时, 而且实验中还会遇到一些目前无法解决的技术困难,因此人们非常希望利用理论 计算的方法直接从序列信息出发来预测蛋白质结构,这是生物信息学研究的重要 课题之一。 目前,直接从氨基酸序列信息出发来预测蛋白质三级结构还是有很多困难。 更多的焦点集中在去预测蛋白质二级结构。 由于二级结构单元是多肽链在三维空间折叠的基本元素,二级结构预测通常 作为蛋白质空间结构预测的第一步,是蛋白质三级结构预测中重要的中间步骤, 也是蛋白质折叠理论研究的重要挑战。本文重点介绍了一种新的方法,即基于4 肽结构字的多样性增量二次判别法(简称TPIDQD算法),对2个大小不同的数据 库进行了二级结构的预测。 同时对325个标准样本集合,进行了二级结构和三级结构关联的研究。(1) 新的预测算法大体分三步:首先用定义的三种4肽结构字(alpha、beta、coil) 在序列中出现的频次作为多样源,从而建立标准源;然后用多样性增量结合二次 判别法对任何一个序列片段中心残基的二级结构进行预测;最后进行一些修正后 处理,包括:消除预测中的结构涨落以及用4肽边界字来修正预测后的结构边界。 (2)用TPIDQD算法首次对CB513数据库的二级结构进行了预测,3折交叉

腾讯文库蛋白质二级结构的预测以及二级结构与三级结构之间关联的探讨