首页 > 运维 > 知识 > 数据挖掘期末考试题及答案详解,数据挖掘题目

数据挖掘期末考试题及答案详解,数据挖掘题目

来源:整理 时间:2024-08-06 01:38:33 编辑:黑码技术 手机版

本文目录一览

1,数据挖掘题目

1: 孤立点分析: 去掉离群点,噪声点(当然主要靠业务分析) 数据平滑: 使整体数据更加平滑,趋势更明显,减小波动 正态化: 这个是统计学的基础要求,所有数据必须朝这个方向处理 离散数据连续化:某些算法只能处理这种数据,反之既然 其他参考数据挖掘书籍(其实更重要是弄清楚X,Y各是什么)2: 1) 自己研究excel,很简单 2)3) 变换就那么几种,ln, e, 乘个什么数,除个什么数,自己研究一下

数据挖掘题目

2,数据挖掘概念与技术第三版答案

邮件已经发出,过几分钟后记得查收(可能在垃圾箱里边),收到后觉得还算满意请点下边的采纳通知我。如果10分钟后还没收到,请直接在本问题里追问我,我会再次发送。最后如果在采纳之余能加点分数,那就OK!下载地址:http://www.siludao.com/khda/t165437.html
一般的话第三版要比前两本版本的内容更为丰富一下,我看了第三版里面有些内容比较深是不需要看的,依据个人水平吧!这本书好的是在前沿部分将整本书的模块都分析了出来,比较实用

数据挖掘概念与技术第三版答案

3,关于数据挖掘的两道题希望能详细解释可以让一个新手听懂答案

恩,怎么说呢?最小支持度就是一个元素在若干个集合中出现的次数的最少次数的阀值。比如你有5个集合,就拿你的第二道题来说:那么A的支持度就是60%,B是80%,C是80%,D是60%。因为一共取了五次,每次可能有ABCD中的一个或者几个,那么有几个中包含A,这就是支持度。拿元素A来说,在1,2,3中包含A,但是在4,5中没有。那么3/5=0.6就是他的支持度。同样再看下B,B在1,2,4,5中存在,3中没有,那么他的支持度就是4/5=0.8=80%。再说置信度:置信度是说在存在一个元素的集合中另外一个元素存在的概率。我们还用第二题举例:比如在存在A的集合中存在B的概率是多少?我们找找:存在A的集合有1,2,3三个。在这三个中1,2,两个包含B。也就是说B的置信度为2/3≈66.7%。我们再找B到C。存在B的集合有1,2,4,5四个。那么在这里面存在C的有几个?2,4,5三个,所以B到C的置信度就是3/4=75%其他的也是这么计算。具体的答案我就不算了,你自己再看看。

关于数据挖掘的两道题希望能详细解释可以让一个新手听懂答案

4,数据挖掘的最小最大规范化实是习题

<p>欧氏距离公式为:d=sqrt( ∑(xi1-xi2)^2 ) 这里i=1,2..n,所以欧几里得距离为(12-30)^2+(1-0)^2+(50-36)^2+(10-6)^2的算术平方根,即537的开2次根(这里打不出公式,所以只能用文字啊)!!</p> <p> </p> <p>曼哈顿距离为:坐标(x1, y1)的点P1与坐标(x2, y2)的点P2的曼哈顿距离|x1 - x2| + |y1 - y2|,所以答案为:|12-30|+|1-0|+|50-36|+|10-6|=37!!!</p> <p> </p> <p>最小-最大规范化对原始数据进行线性变换。假定minA 和maxA 分别为属性A的最小和最大值,通过公式可以将 A 的值 v映射到区间[new_minA ,new_maxA ]中的 v。你的题目中没有指明指定数值空间,但聚类一般为0到1(这一点我不是很确定),处理公式为</p> <p></p> <p>如果是按0-1来算的话,那么公式可以简化为(V-minA)/(maxA-minA),然后对A中每一个数都这样处理得到(11/49,0,1,9/49)。这是我的答案,仅供产考。。</p>

5,关于数据挖掘中频繁项集的题目

对答案C不包含的解释可以是:由1,2,4,5所能产生的1,4,5三项集不包含在给出的频繁3-项集中,1,2,4,5不可能会是频繁4-项集。其余所有4项集能分解出来的全部3-项集都包含在给出的频繁3-项集中。 不过这个问题的前提不是很清楚,对于1,3,4,5也有1,4,5不出现在给出的频繁3-项集的问题,按理也不应该包含在4-项集中才对。这也许是题目中“合并策略”的条件所限定的。本人对“合并策略”是种什么策略不很了解。不知道是我的知识缺陷还是出题有问题,我查查看,要是知道答案再来完善。 不过,本人从事关联规则挖掘研究超过10年,看的论文没有百篇也有好几十篇,真对“合并策略”没印象,感觉是出题有误。
根据数据挖掘Apriori算法的性质之一:判定是否可作为K项频繁集是通过K项集分裂为K个K-1项集,考察K-1项集是否为Lk-1,要生成4-项集,{1,2,4,5}分裂后为{1,2,4}{2,4,5}{1,2,5}{1,4,5}其中,{1,4,5}不属于频繁3项集,所以{1,2,4,5}不能作为4项集,因为有性质为:任何非频繁的K-1项集都不可能是频繁项集K项集的子集。A、B、D你分别可以试一下,分裂后的子集是否为频繁三项集。例如:{1.2.3.4}分裂后:{1,2,4}{2,3,4}{1,3,4}{1,2,3}均满足频繁三项集里的子集。
频繁项集(frequent itemset)s是指购物篮中至少出现比例(support)为s的集合,其中s为给定的常数。只要该项集出现比例达到你给定的常数s,这些项集都是频繁项集。
文章TAG:数据数据挖掘挖掘期末数据挖掘期末考试题及答案详解

最近更新