分布式课程论文
分布式数据库中的数据存储摘 要:在信息技术的飞速发展下,人们信息处理活动更加丰富,传统的存储方式已经不适合现代社 会的发展趋势,信息时代的特征把分布式数据埠技术推向了现代存储技术的舞台,分布式DBMS
分布式数据库中的数据存储 摘要:在信息技术的飞速发展下,人们信息处理活动更加丰富,传统的存储方式已经不适合现代社会的发 展趋势,信息时代的特征把分布式数据埠技术推向了现代存储技术的舞台,分布式的出现无疑在很 DBMS 人程度上满足了用户在信息处理方面的需求。然而在分布式小,关系可以存储于若 DBMS 干场地,访问存储于远程场地的数据将导致额外的传输代价。通过合理的存储方法来减少此代价,成为了 数据库开发人员急需解决的问题。木文主要针对这一问题展开研究。 分布式数据库;数据存储;划分; 复制 DataStorageintheDistributedDatabase Abstract : Intherapiddevelopmentofinformationtechnology,peopleprocessricherandricherinformation. Traditionalstoragemethodisnotsuitableforthedevelopmenttrendofthemodernsociety.Thecharacteristics oftheinformationageforwardthedistributeddatabasetechnologytothestageofmodemstoragetechnology. ThisemergenceofdistributedDBMSisundoubtedlyandlargelymeetstheusers'needsintheinformation processing.However,inadistributedDBMS,therelationcanbestoredinseveralsites.Accessingtodata storedintheremotesiteswillresultinadditionaltransportcosts.Therefore,toreducethecostthrougha reasonablestoragemethodhasbecometheurgentproblemfordatabasedevelopmentpersonneltosolve.This studymainlyfocusesonthisissue. Keywords : distributeddatabase;datastorage;division;replication 1 引言 对于集屮式的数据管理系统,大家应该并不陌生在这类系统中,数据在独立的站点进行管理,并且假 定顺序地进行事务处理而在分布式数据库屮,关系可以存储于若干场地,访问存储于远程场地的数据将导 致额外的传输代价此代价也成为了分布式制约数据库数据处理的瓶颈,而减少此代价最口然的方法就是合 理的数据存储因此,如何在数据库中进行数据存储就显得尤为重要。 分布式数据库系统是在集小式数据库系统的基础上发展起来的,是计算机技术和网络技术结合的产物。 分布式数据库系统适合于单位分散的部门,允许各个部门将其常用的数据存储在木地,实施就地存放本地 使用,从而提高响应速度,降低通信费用。基于网络基础上的分布式数据库系统经常对数据库进行数据分 片。从数据意义上讲,数据分布的合理少否不仅影响着访问的局部性,而且也制约着数据查询及事务处理 的效率。 在分布式数据库屮,数据存储包括数据分片和数据分配两个部分。数据分片和分布是分布式数据库中 两个重耍概念,分布式数据库大部分问题均与数据分片和分布有关,它们对整个系统的可用性、可靠性、 及效率都有极人的影响,同时也与分布式数据库系统的其他方面密切相关,尤其是分布式杏询处理问题。 以关系数据库为例,在关系型分布式数据库系统中,数据分片是从逻辑上将全局关系划分为逻辑 (RDDB) 片断即子关系,而数据分配就是再以一定的冗余度将子关系分配到多个结点上,数据存储即数据分片与数 据分配的总和。数据分片是一种対关系的划分,在集中式数据库中可以将所有的表视为一个总全局表的逻 辑子表,而总全局表是这些子表的并集,其属性包括这些子表的所有属性,元组包括这些子表的所有元组, 对应的在这个总全局表上元组的非空值呈块状区域分布。数据分配则是将这些子表以不同的冗余度存放在 一个或多个场地或节点,这两者间的区别在于集中式数据库不存在数据复制的问题,不需要存在多副本, 但也会出现表名不同,但表属性和属性值完全相同。

