大数据图书馆管理论文
大数据图书馆管理论文 一、大数据的基本特征 (一)类型繁多(Variety) 数据通常被分为结构化数据、半结构化数据和非结构化数据。相对于传统的以文本为主的结构化数据,网络日志、
17 第页共页 大数据图书馆管理论文 一、大数据的基本特征 (一)类型繁多(Variety) 数据通常被分为结构化数据、半结构化数据和非结构化数据。相 对于传统的以文本为主的结构化数据,网络日志、音频、视频、图片、 地理位置信息等半结构化、非结构化数据越来越多。同时,近几年出 现的微博、 等可通过移动互联设备使用的电子交往形式使数据量和 数据种类更加复杂化。 (二)价值不高(Value) 价值密度的高低与数据总量的大小成反比。以社会中常见的监控 录像为例,一天的监控记录,有用数据可能仅有一二秒。如何将已有 的结构化数据、半结构化数据及非结构化数据进行整合、分析,挖掘 出更多有价值的信息,并通过强大的计算能力迅速地完成数据的价值 "提纯"成为目前大数据背景下亟待解决的难题。 (三)要求高速处理(Velocity)

