精编漏洞库数据挖掘论文
漏洞库数据挖掘论文1基础概念介绍 1.1数据挖掘 数据挖掘(DM)融合了多个领域的理论和技术,如人工智能、数据库、模式识别、统计学等技术。数据挖掘常与数据库中的“知识发现”(KDD,Kno
漏洞库数据挖掘论文 1基础概念介绍 1.1数据挖掘 数据挖掘(DM)融合了多个领域的理论和技术,如人工智能、数据库、模式识 别、统计学等技术。数据挖掘常与数据库中的“知识发现”(KDD, KnowledgeDiscoveryinDatabase)进行比较,对于两者之间的关系,学术界有很 多不同见解。数据挖掘属于整个知识挖掘过程的一个核心步骤。 1.2信息安全漏洞 漏洞(Vulnerability),又称为缺陷。对信息安全漏洞的定义最早是在1982 年,由美国著名计算机安全专家D.Denning提出,D.Longley等人从风险管理的 角度分三个方面描述漏洞的含义,M.Bishop等人采用状态空间描述法定义漏洞, 权威机构如美国NIST在《信息安全关键术语词汇表》以及国际标准化组织发布 的ISO/IEC《IT安全术语词汇表》中也对漏洞进行定义。世界上比较较知名的漏 洞数据库包括美国国家漏洞库NVD(NationalVulnerabilityDatabase)、丹麦的 Secunia漏洞信息库等,我国在2009年也建成了中国国家信息安全漏洞库CNNVD。 本文选取Secu-nia漏洞库的漏洞数据作为样本进行数据挖掘。 2数据挖掘算法 2.1数据挖掘任务 数据挖掘任务主要是发现在数据中隐藏的潜在价值。数据挖掘模式主要分为 两种:描述型和预测型。描述模式是对历史数据中包含的事实进行规范描述,从 而呈现出数据的一般特性;预测模式通常以时间作为参考标准,通过数据的历史 值预测可能的未来值。依照不同的模式特征,细分六类模式:预测模式、关联模 式、序列模式、分类模式、回归模式以及聚类模式。本文主要针对关联模式进行 深入探讨。 2.2关联规则分析及算法 关联规则算法是指相关性统计分析,基于分析离散事件之间的相关性统计而 建立关联规则,关联规则算法是定量分析,所以必须将样本中的数据进行离散化 操作,此算法是基于大量数据样本的优化算法。 1

