商业智能与 R 语言期末考试
结合本课程所学知识,从你熟悉的应用问题中获取数据,并使用以下知识点对数据进行分析、预测或者聚类(不得使用课堂所讲案例),形成分析报告。
一、选题中必须使用的知识点
1、对数据的规范化处理(正态归一化、分位点)。
2、分类与预测方法,包括 Fisher 线性判别法、决策树方法、支撑向量机 SVM
方法。
3、聚类方法,包括 kmeans,层次聚类等。
4、离群点分析与异常检测方法, 包括基于箱底规则的方法、基于线性回归
的方法、基于离群因子的方法、基于聚类的方法等。
5、社会网络分析方法, 包括网络群集发现、三角形侦测。鼓励选用教师提
供的海关数据。
6、时序数据分析与预测,包括股票分析技术。
7、主成分分析方法
8、关联规则挖掘算法,包括 Apriori 算法。
二、选题过程
2-3 人组成小组共同选题,选题过程需与教师商定并经过教师确认,工作量足够充实,选题才有效。
三、数据分析报告的内容
1、选题背景
2、数据来源与数据描述
3、R 语言代码
4、运行结果(要求包括有图表和结论)。
四、成绩评定
第 18 周以小组分别答辩的形式,每组同学派一位代表对选题背景和数据来源进行说明,并进行程序演示,由教师进行评定,小组评定成为小组内同学的期末成绩。