数据挖掘计算题参考答案

数据仓库与数据挖掘复习题1. 假设数据挖掘的任务是将如下的8个点(用(x,y)代表位置)聚类为3个类:X1(2,10)、X2(2,5)、X3(8,4)、X4(5,8)、X5(7,5)、X6(6,4)、

数据仓库与数据挖掘复习题 1.8x,y3 假设数据挖掘的任务是将如下的个点(用()代表位置)聚类为个类: X1(2,10)X2(2,5)X3(8,4)X4(5,8)X5(7,5)X6(6,4)X7(1,2)X8(4,9) 、、、、、、、,距离选 X1(2,10)X4(5,8)X7(1,2) 择欧几里德距离。假设初始选择、、为每个聚类的中心,请 K_means 用算法来计算: 13 ()在第一次循环执行后的个聚类中心; 1X1(210)2X4(58)X7(12) 答:第一次迭代:中心点:,,:,,, X8 X1 X2 X3 X4 X5 X6 X7 4+1 1 0 25 36+36 9+4 25+25 16+36 1+64 1+1 2 9+4 9+9 9+16 0 4+9 1+16 16+36 58 3 1+64 1+9 53 16+36 45 29 0 3 答案:在第一次循环执行后的个聚类中心: 1X1(210) :, 2X3X4X5X6X866 :,,,,(,) 3X2X71.53.5 :,(,) 23 ()经过两次循环后,最后的个族分别是什么? 第二次迭代: X8 d² X1 X2 X3 X4 X5 X6 X7 4+1 1 0 25 36+36 9+4 25+25 16+36 1+64 1+1 2 32 17 8 5 2 4 41 2.5²+5.5² 3 5²+6.5² 5²+1.5² 6.5²+0.5² 3.5²+4.5² 5.5²+1.5² 4.5²+0.5² 0.5²+1.5² 1X1X8(3.59.5) 答案::,, 2X3X4X5X66.55.25 :,,,(,) 3X2X71.53.5 :,(,) 2.4min_sup=60%,min_conf=80% 数据库有个事务。设。 TID data Transaction T100 6/6/2007 K,A,D,B T200 6/6/2007 D,A,C,E,B T300 6/7/2007 C,A,B,E T400 6/10/2007 B,A,D a. Apriori 使用算法找出频繁项集,并写出具体过程。 1

腾讯文库数据挖掘计算题参考答案