商业智能与 R 语言期末考试 
结合本课程所学知识,从你熟悉的应用问题中获取数据,并使用以下知识点对数据进行分析、预测或者聚类(不得使用课堂所讲案例),形成分析报告。 
一、选题中必须使用的知识点 
1、对数据的规范化处理(正态归一化、分位点)。 
2、分类与预测方法,包括 Fisher 线性判别法、决策树方法、支撑向量机 SVM 
方法。 
3、聚类方法,包括 kmeans,层次聚类等。 
4、离群点分析与异常检测方法, 包括基于箱底规则的方法、基于线性回归 
的方法、基于离群因子的方法、基于聚类的方法等。 
5、社会网络分析方法, 包括网络群集发现、三角形侦测。鼓励选用教师提 
供的海关数据。 
6、时序数据分析与预测,包括股票分析技术。 
7、主成分分析方法 
8、关联规则挖掘算法,包括 Apriori 算法。 
二、选题过程 
2-3 人组成小组共同选题,选题过程需与教师商定并经过教师确认,工作量足够充实,选题才有效。 
三、数据分析报告的内容 
1、选题背景 
2、数据来源与数据描述 
3、R 语言代码 
4、运行结果(要求包括有图表和结论)。 
四、成绩评定 
第 18 周以小组分别答辩的形式,每组同学派一位代表对选题背景和数据来源进行说明,并进行程序演示,由教师进行评定,小组评定成为小组内同学的期末成绩。
