生物信息学期末考试重点
生物信息学期末考试重点数据库(Database)是按照 数据结构来组织、 存储和管理数据的仓库;它产生于距今六十多年前;随着 信息技术和市场的发展;特别是二十世纪九十年代以后; 数据管
1、 生物信息学期末考试重点 2、 数据库(Database)是按照来组织、和管理数据的仓库;它产 数据结构存储 生于距今六十多年前;随着和市场的发展;特别是二十世纪九十年代 信息技术 以后;不再仅仅是存储和管理数据;而转变成用户所需要的各种数据 数据管理 管理的方式。数据库有很多种;从最简单的存储有各种数据的到能 类型表格 够进行海量的大型都在各个方面得到了广泛的应用。 数据存储数据库系统 3、 表达序列标签 从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的 短的cDNA 部分序列;代表一个完整基因的一小部分;在数据库中其长度一般从 20 到7000bp 不等;平均长度为360 ±120bp。EST 来源于一定环境下一个组织 总mRNA 所构建的cDNA 文库;因此EST也能说明该组织中各基因的表达水平。 4、 开放阅读框 是序列中的一段无终止序列打断的序列;可编码相应的 基因碱基 。ORF识别包括检测六个阅读框架并决定哪一个包含以和 蛋白启动子终止子 为界限的DNA序列而其内部不包含启动子或终止子;符合这些条件的序列有可能 对应一个真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的 蛋白质编码基因的部分或全部的先决条件。 5、 蛋白质的一级结构 在每种蛋白质中按照一定的数目和组成进行排列;并 氨基酸 进一步折叠成特定的前者我们称为蛋白质的一级结构;也叫初级结构 空间结构 或基本结构。蛋白质一级结构是理解、作用机制以及与其同源 蛋白质结构蛋 的必要基础。 白质生理功能 6、 基因识别 是生物信息学的一个重要分支;使用生物学实验或计算机等手段识别 DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因; 也包括其他具有一定生物学功能的因子;如RNA基因和调控因子。基因识别是基 因组研究的基础。 7、 单核苷酸多态 指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态 性。这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起;也可由 碱基的插入或缺失所致;它是人类可遗传的变异中最常见的一种。占所有已知多态 性的90%以上。 1/ 7

