一、实验目的

使用蛋白质摄取的数据集protein.txt，说明蛋白质摄取的聚类分析操作。
数据导入操作，使用输入函数read.table()的操作。
数据标准化操作，使用函数scale()的操作。
数据聚类建立模型操作，使用函数kmeans()的操作。
列出实验结果包含绘图以及完整代码包含注解。
二、实验内容
说明 1: 举一个蛋白质摄取的档案protein.txt进行聚类说明，共有25个欧洲国家，即25笔纪录，字段有country、 Redmeat、Whitemeat、Eggs、Milk、Fish、Cereals、Starch、Nuts和Frozen Vegetable，档案内容如下：

说明 2: 使用函数read.table()将原始数据集protein.txt，导入R工作空间。
说明 3: 使用函数scale() 将数据标准化。
说明 4: 使用函数kmeans() 建立数据聚类模型，并列出实验结果包含绘图以及完整代码包含注解。

三、实验报告

1. 实验环境：

Win10

2. 实验内容与完成情况：

1）实验参考源代码

url<-“Add your working path.”
setwd(url)
protein<-read.table(“protein.txt”, sep=” “, header=TRUE)
summary(protein)
#Data preprocessing
v<-colnames(protein)[-1]
pmatrix<-scale(protein[,v])
#Clustering
k<-5
pclusters<-kmeans(pmatrix, k, nstart=10, iter.max=10)
summary(pclusters)
#Resaults
groups<-pclusters$cluster
print_clusters <- function(labels,k)
{
for(i in 1:k)
{
print(paste(“聚类”,i))
print(protein[labels==i,
c(“Country”,”RedMeat”,”Fish”,”Fr.Veg”)])
}
}
print_clusters(groups,k)