实验要求:

  1. 鸢尾花有四个特征,分别为:萼片长度(Sepal Length)、萼片宽度(Sepal Width)、花瓣长度(Petal Length)、花瓣宽度(Petal Width),单位为厘米。
  2. 鸢尾花分为山鸢尾(Iris Setosa)、杂色鸢尾(Iris Versicolour)和为吉尼亚鸢尾(Iris Virginica)三种,在数据集最后一列(Class)分别以0、1、2三种标签表示。
  3. 请将数据有缺失的行删除,请将出现明显错误数据的行删除(负数等)。
  4. 求出每种鸢尾花萼片长度的平均值、中位数和标准差。
  5. 归一化:创建一种标准化形式的鸢尾花特征数据,其值正好介于0和1之间,这样最小值为0,最大值为1。
  6. 将数据清洗及归一化后的结果保存为新的csv文件。

上机实现

添加需要使用到的包

  1. import pandas as pd
  2. import numpy as np
  3. import os
  4. import csv
  5. from sklearn import preprocessing
  6. from sklearn import datasets

导入需要用到的脏数据集

iris.csv

  1. data_dir = "D:\\DataAnalysis"
  2. fname = os.path.join(data_dir,"iris.csv")
  3. f = open(fname,encoding='utf-8')
  4. df = pd.read_csv(f)
  5. f.close()
  6. print(type(df))
  1. <class 'pandas.core.frame.DataFrame'>
  1. df
Sepal Length Sepal Width Petal Length Petal Width Class
0 0.0 NaN NaN NaN NaN
1 5.1 3.5 1.4 0.2 0.0
2 4.9 3.0 1.4 0.2 0.0
3 3.0 NaN NaN NaN NaN
4 4.7 3.2 1.3 0.2 0.0
5 4.6 3.1 1.5 0.2 0.0
6 5.0 3.6 1.4 0.2 0.0
7 5.4 3.9 1.7 0.4 0.0
8 NaN 4.0 2.3 0.3 NaN
9 4.6 3.4 1.4 0.3 0.0
10 5.0 3.4 1.5 0.2 0.0
11 4.4 2.9 1.4 0.2 0.0
12 4.9 3.1 1.5 NaN 0.0
13 4.9 3.1 1.5 0.1 0.0
14 5.4 3.7 1.5 0.2 0.0
15 4.8 3.4 1.6 0.2 0.0
16 4.8 3.0 1.4 0.1 0.0
17 4.3 3.0 1.1 0.1 0.0
18 5.8 4.0 1.2 0.2 0.0
19 5.7 4.4 1.5 0.4 0.0
20 5.7 -9.0 1.5 0.4 0.0
21 5.4 3.9 1.3 0.4 0.0
22 5.1 3.5 1.4 0.3 0.0
23 5.7 3.8 1.7 0.3 0.0
24 5.1 3.8 1.5 0.3 0.0
25 5.4 3.4 1.7 0.2 NaN
26 5.4 3.4 1.7 0.2 0.0
27 5.1 3.7 1.5 0.4 0.0
28 4.6 3.6 1.0 0.2 0.0
29 5.1 3.3 1.7 0.5 0.0
127 5.6 2.8 4.9 2.0 2.0
128 7.7 2.8 6.7 2.0 2.0
129 6.3 2.7 4.9 1.8 2.0
130 6.7 3.3 5.7 2.1 2.0
131 7.2 3.2 6.0 1.8 2.0
132 6.2 2.8 4.8 1.8 2.0
133 6.1 3.0 4.9 1.8 2.0
134 6.4 2.8 5.6 2.1 2.0
135 7.2 3.0 5.8 1.6 2.0
136 7.4 2.8 6.1 1.9 2.0
137 7.9 3.8 6.4 NaN NaN
138 7.9 3.8 6.4 2.0 2.0
139 6.4 2.8 5.6 2.2 2.0
140 6.3 2.8 5.1 1.5 2.0
141 6.1 2.6 5.6 1.4 2.0
142 7.7 3.0 -6.1 2.3 2.0
143 6.3 3.4 NaN 2.4 2.0
144 6.4 3.1 5.5 1.8 2.0
145 6.0 3.0 4.8 1.8 2.0
146 6.9 3.1 5.4 2.1 2.0
147 6.7 3.1 5.6 2.4 2.0
148 6.9 3.1 5.1 2.3 2.0
149 5.8 2.7 5.1 1.9 2.0
150 6.8 3.2 5.9 -2.3 2.0
151 6.7 3.3 5.7 2.5 2.0
152 6.7 3.0 5.2 2.3 2.0
153 6.3 2.5 5.0 1.9 2.0
154 6.5 3.0 NaN 2.0 2.0
155 6.2 3.4 5.4 2.3 2.0
156 5.9 3.0 5.1 1.8 2.0

157 rows × 5 columns

数据预处理

使用dropna()删除数据有缺失的行

  1. print(df.isnull())
  2. df = df.dropna()
  3. df
  1. Sepal Length Sepal Width Petal Length Petal Width Class
  2. 0 False True True True True
  3. 1 False False False False False
  4. 2 False False False False False
  5. 3 False True True True True
  6. 4 False False False False False
  7. 5 False False False False False
  8. 6 False False False False False
  9. 7 False False False False False
  10. 8 True False False False True
  11. 9 False False False False False
  12. 10 False False False False False
  13. 11 False False False False False
  14. 12 False False False True False
  15. 13 False False False False False
  16. 14 False False False False False
  17. 15 False False False False False
  18. 16 False False False False False
  19. 17 False False False False False
  20. 18 False False False False False
  21. 19 False False False False False
  22. 20 False False False False False
  23. 21 False False False False False
  24. 22 False False False False False
  25. 23 False False False False False
  26. 24 False False False False False
  27. 25 False False False False True
  28. 26 False False False False False
  29. 27 False False False False False
  30. 28 False False False False False
  31. 29 False False False False False
  32. .. ... ... ... ... ...
  33. 127 False False False False False
  34. 128 False False False False False
  35. 129 False False False False False
  36. 130 False False False False False
  37. 131 False False False False False
  38. 132 False False False False False
  39. 133 False False False False False
  40. 134 False False False False False
  41. 135 False False False False False
  42. 136 False False False False False
  43. 137 False False False True True
  44. 138 False False False False False
  45. 139 False False False False False
  46. 140 False False False False False
  47. 141 False False False False False
  48. 142 False False False False False
  49. 143 False False True False False
  50. 144 False False False False False
  51. 145 False False False False False
  52. 146 False False False False False
  53. 147 False False False False False
  54. 148 False False False False False
  55. 149 False False False False False
  56. 150 False False False False False
  57. 151 False False False False False
  58. 152 False False False False False
  59. 153 False False False False False
  60. 154 False False True False False
  61. 155 False False False False False
  62. 156 False False False False False
  63. [157 rows x 5 columns]

预览以下处理好的数据集:

Sepal Length Sepal Width Petal Length Petal Width Class
1 5.1 3.5 1.4 0.2 0.0
2 4.9 3.0 1.4 0.2 0.0
4 4.7 3.2 1.3 0.2 0.0
5 4.6 3.1 1.5 0.2 0.0
6 5.0 3.6 1.4 0.2 0.0
7 5.4 3.9 1.7 0.4 0.0
9 4.6 3.4 1.4 0.3 0.0
10 5.0 3.4 1.5 0.2 0.0
11 4.4 2.9 1.4 0.2 0.0
13 4.9 3.1 1.5 0.1 0.0
14 5.4 3.7 1.5 0.2 0.0
15 4.8 3.4 1.6 0.2 0.0
16 4.8 3.0 1.4 0.1 0.0
17 4.3 3.0 1.1 0.1 0.0
18 5.8 4.0 1.2 0.2 0.0
19 5.7 4.4 1.5 0.4 0.0
20 5.7 -9.0 1.5 0.4 0.0
21 5.4 3.9 1.3 0.4 0.0
22 5.1 3.5 1.4 0.3 0.0
23 5.7 3.8 1.7 0.3 0.0
24 5.1 3.8 1.5 0.3 0.0
26 5.4 3.4 1.7 0.2 0.0
27 5.1 3.7 1.5 0.4 0.0
28 4.6 3.6 1.0 0.2 0.0
29 5.1 3.3 1.7 0.5 0.0
30 4.8 3.4 1.9 0.2 0.0
31 5.0 3.0 1.6 0.2 0.0
32 5.0 3.4 1.6 0.4 0.0
33 5.2 3.5 1.5 0.2 0.0
34 5.2 3.4 1.4 0.2 0.0
123 7.7 3.8 6.7 2.2 2.0
125 6.0 2.2 5.0 1.5 2.0
126 6.9 3.2 5.7 2.3 2.0
127 5.6 2.8 4.9 2.0 2.0
128 7.7 2.8 6.7 2.0 2.0
129 6.3 2.7 4.9 1.8 2.0
130 6.7 3.3 5.7 2.1 2.0
131 7.2 3.2 6.0 1.8 2.0
132 6.2 2.8 4.8 1.8 2.0
133 6.1 3.0 4.9 1.8 2.0
134 6.4 2.8 5.6 2.1 2.0
135 7.2 3.0 5.8 1.6 2.0
136 7.4 2.8 6.1 1.9 2.0
138 7.9 3.8 6.4 2.0 2.0
139 6.4 2.8 5.6 2.2 2.0
140 6.3 2.8 5.1 1.5 2.0
141 6.1 2.6 5.6 1.4 2.0
142 7.7 3.0 -6.1 2.3 2.0
144 6.4 3.1 5.5 1.8 2.0
145 6.0 3.0 4.8 1.8 2.0
146 6.9 3.1 5.4 2.1 2.0
147 6.7 3.1 5.6 2.4 2.0
148 6.9 3.1 5.1 2.3 2.0
149 5.8 2.7 5.1 1.9 2.0
150 6.8 3.2 5.9 -2.3 2.0
151 6.7 3.3 5.7 2.5 2.0
152 6.7 3.0 5.2 2.3 2.0
153 6.3 2.5 5.0 1.9 2.0
155 6.2 3.4 5.4 2.3 2.0
156 5.9 3.0 5.1 1.8 2.0

148 rows × 5 columns

进行数据的运算

求出花萼片长度的平均值

  1. df['Sepal Length'].groupby(df['Class']).mean()
  1. Class
  2. 0.0 5.019608
  3. 1.0 5.471600
  4. 2.0 6.572340
  5. Name: Sepal Length, dtype: float64

求出花萼片长度的中位数

  1. df['Sepal Length'].groupby(df['Class']).median()
  1. Class
  2. 0.0 5.00
  3. 1.0 5.85
  4. 2.0 6.50
  5. Name: Sepal Length, dtype: float64

求出花萼片长度的标准差

  1. df['Sepal Length'].groupby(df['Class']).std()
  1. Class
  2. 0.0 0.362226
  3. 1.0 2.382693
  4. 2.0 0.633727
  5. Name: Sepal Length, dtype: float64

归一化处理

  1. # 建立MinMaxScaler模型对象
  2. m_scaler = preprocessing.MinMaxScaler()
  3. # 使用 MinMaxScaler 对象 对数据进行归一化处理
  4. m_data = m_scaler.fit_transform(df)
  5. x=m_data.flatten()
  6. print(x)
  1. [0.80028531 0.93283582 0.5859375 0.52083333 0. 0.78601997
  2. 0.89552239 0.5859375 0.52083333 0. 0.77175464 0.91044776
  3. 0.578125 0.52083333 0. 0.76462197 0.90298507 0.59375
  4. 0.52083333 0. 0.79315264 0.94029851 0.5859375 0.52083333
  5. 0. 0.82168331 0.96268657 0.609375 0.5625 0.
  6. 0.76462197 0.92537313 0.5859375 0.54166667 0. 0.79315264
  7. 0.92537313 0.59375 0.52083333 0. 0.75035663 0.8880597
  8. 0.5859375 0.52083333 0. 0.78601997 0.90298507 0.59375
  9. 0.5 0. 0.82168331 0.94776119 0.59375 0.52083333
  10. 0. 0.7788873 0.92537313 0.6015625 0.52083333 0.
  11. 0.7788873 0.89552239 0.5859375 0.5 0. 0.74322397
  12. 0.89552239 0.5625 0.5 0. 0.85021398 0.97014925
  13. 0.5703125 0.52083333 0. 0.84308131 1. 0.59375
  14. 0.5625 0. 0.84308131 0. 0.59375 0.5625
  15. 0. 0.82168331 0.96268657 0.578125 0.5625 0.
  16. 0.80028531 0.93283582 0.5859375 0.54166667 0. 0.84308131
  17. 0.95522388 0.609375 0.54166667 0. 0.80028531 0.95522388
  18. 0.59375 0.54166667 0. 0.82168331 0.92537313 0.609375
  19. 0.52083333 0. 0.80028531 0.94776119 0.59375 0.5625
  20. 0. 0.76462197 0.94029851 0.5546875 0.52083333 0.
  21. 0.80028531 0.91791045 0.609375 0.58333333 0. 0.7788873
  22. 0.92537313 0.625 0.52083333 0. 0.79315264 0.89552239
  23. 0.6015625 0.52083333 0. 0.79315264 0.92537313 0.6015625
  24. 0.5625 0. 0.80741797 0.93283582 0.59375 0.52083333
  25. 0. 0.80741797 0.92537313 0.5859375 0.52083333 0.
  26. 0.77175464 0.91044776 0.6015625 0.52083333 0. 0.7788873
  27. 0.90298507 0.6015625 0.52083333 0. 0.82168331 0.92537313
  28. 0.59375 0.5625 0. 0.80741797 0.97761194 0.59375
  29. 0.5 0. 0.82881598 0.98507463 0.5859375 0.52083333
  30. 0. 0.78601997 0.90298507 0.59375 0.52083333 0.
  31. 0.79315264 0.91044776 0.5703125 0.52083333 0. 0.82881598
  32. 0.93283582 0.578125 0.52083333 0. 0.78601997 0.94029851
  33. 0.5859375 0.5 0. 0.75035663 0.89552239 0.578125
  34. 0.52083333 0. 0.80028531 0.92537313 0.59375 0.52083333
  35. 0. 0.79315264 0.93283582 0.578125 0.54166667 0.
  36. 0.7574893 0.84328358 0.578125 0.54166667 0. 0.75035663
  37. 0.91044776 0.578125 0.52083333 0. 0.79315264 0.93283582
  38. 0.6015625 0.60416667 0. 0.80028531 0.95522388 0.625
  39. 0.5625 0. 0.7788873 0.89552239 0.5859375 0.54166667
  40. 0. 0.80028531 0.95522388 0.6015625 0.52083333 0.
  41. 0.76462197 0.91044776 0.5859375 0.52083333 0. 0.81455064
  42. 0.94776119 0.59375 0.52083333 0. 0.79315264 0.91791045
  43. 0.5859375 0.52083333 0. 0.93580599 0.91044776 0.84375
  44. 0.77083333 0.5 0.89300999 0.91044776 0.828125 0.79166667
  45. 0.5 0.92867332 0.90298507 0.859375 0.79166667 0.5
  46. 0.82881598 0.84328358 0.7890625 0.75 0.5 0.90014265
  47. 0.88059701 0.8359375 0.79166667 0.5 0.84308131 0.88059701
  48. 0.828125 0.75 0.5 0.88587732 0.91791045 0.84375
  49. 0.8125 0.5 0.78601997 0.85074627 0.734375 0.6875
  50. 0.5 0.90727532 0.8880597 0.8359375 0.75 0.5
  51. 0.80741797 0.87313433 0.78125 0.77083333 0.5 0.79315264
  52. 0.82089552 0.75 0.6875 0.5 0.85734665 0.89552239
  53. 0.8046875 0.79166667 0.5 0.86447932 0.8358209 0.7890625
  54. 0.6875 0.5 0.87161198 0.8880597 0.84375 0.77083333
  55. 0.5 0.83594864 0.8880597 0.7578125 0.75 0.5
  56. 0.91440799 0.90298507 0.8203125 0.77083333 0.5 0.83594864
  57. 0.89552239 0.828125 0.79166667 0.5 0.85021398 0.87313433
  58. 0.796875 0.6875 0.5 0.87874465 0.8358209 0.828125
  59. 0.79166667 0.5 0.83594864 0.85820896 0.78125 0.70833333
  60. 0.5 0.85734665 0.91044776 0.8515625 0.85416667 0.5
  61. 0.87161198 0.88059701 0.7890625 0.75 0.5 0.88587732
  62. 0.85820896 0.859375 0.79166667 0.5 0.87161198 0.88059701
  63. 0.84375 0.72916667 0.5 0.89300999 0.8880597 0.8125
  64. 0.75 0.5 0.90727532 0.89552239 0.8203125 0.77083333
  65. 0.5 0.92154066 0.88059701 0.8515625 0.77083333 0.5
  66. 0.91440799 0.89552239 0.8671875 0.83333333 0.5 0.86447932
  67. 0.8880597 0.828125 0.79166667 0.5 0.84308131 0.86567164
  68. 0.75 0.6875 0.5 0.04422254 0.85074627 0.7734375
  69. 0.70833333 0.5 0.82881598 0.85074627 0.765625 0.6875
  70. 0.5 0.85021398 0.87313433 0.78125 0.72916667 0.5
  71. 0.86447932 0.87313433 0.875 0.8125 0.5 0.82168331
  72. 0.89552239 0.828125 0.79166667 0.5 0.86447932 0.92537313
  73. 0.828125 0.8125 0.5 0.91440799 0.90298507 0.84375
  74. 0.79166667 0.5 0.88587732 0.84328358 0.8203125 0.75
  75. 0.5 0.83594864 0.89552239 0.796875 0.75 0.5
  76. 0.82881598 0.85820896 0.7890625 0.75 0.5 0.82881598
  77. 0.86567164 0.8203125 0.72916667 0.5 0. 0.44776119
  78. 0.8359375 0.77083333 0.5 0.85021398 0.86567164 0.7890625
  79. 0.72916667 0.5 0.79315264 0.84328358 0.734375 0.6875
  80. 0.5 0.83594864 0.87313433 0.8046875 0.75 0.5
  81. 0.84308131 0.89552239 0.8046875 0.72916667 0.5 0.84308131
  82. 0.8880597 0.8046875 0.75 0.5 0.87874465 0.8880597
  83. 0.8125 0.75 0.5 0.80028531 0.85820896 0.7109375
  84. 0.70833333 0.5 0.84308131 0.88059701 0.796875 0.75
  85. 0.5 0.88587732 0.91791045 0.9453125 1. 1.
  86. 0.85021398 0.87313433 0.875 0.875 1. 0.94293866
  87. 0.89552239 0.9375 0.91666667 1. 0.88587732 0.8880597
  88. 0.9140625 0.85416667 1. 0.90014265 0.89552239 0.9296875
  89. 0.9375 1. 0.978602 0.89552239 0.9921875 0.91666667
  90. 1. 0.78601997 0.85820896 0.828125 0.83333333 1.
  91. 0.95720399 0.8880597 0.96875 0.85416667 1. 0.91440799
  92. 0.85820896 0.9296875 0.85416667 1. 0.95007133 0.94029851
  93. 0.953125 1. 1. 0.90014265 0.91044776 0.875
  94. 0.89583333 1. 0.89300999 0.87313433 0.890625 0.875
  95. 1. 0.92154066 0.89552239 0.90625 0.91666667 1.
  96. 0.84308131 0.85820896 0.8671875 0.89583333 1. 0.85021398
  97. 0.88059701 0.875 0.97916667 1. 0.89300999 0.91044776
  98. 0.890625 0.95833333 1. 0.90014265 0.89552239 0.90625
  99. 0.85416667 1. 0.98573466 0.95522388 1. 0.9375
  100. 1. 0.86447932 0.8358209 0.8671875 0.79166667 1.
  101. 0.92867332 0.91044776 0.921875 0.95833333 1. 0.83594864
  102. 0.88059701 0.859375 0.89583333 1. 0.98573466 0.88059701
  103. 1. 0.89583333 1. 0.88587732 0.87313433 0.859375
  104. 0.85416667 1. 0.91440799 0.91791045 0.921875 0.91666667
  105. 1. 0.95007133 0.91044776 0.9453125 0.85416667 1.
  106. 0.87874465 0.88059701 0.8515625 0.85416667 1. 0.87161198
  107. 0.89552239 0.859375 0.85416667 1. 0.89300999 0.88059701
  108. 0.9140625 0.91666667 1. 0.95007133 0.89552239 0.9296875
  109. 0.8125 1. 0.96433666 0.88059701 0.953125 0.875
  110. 1. 1. 0.95522388 0.9765625 0.89583333 1.
  111. 0.89300999 0.88059701 0.9140625 0.9375 1. 0.88587732
  112. 0.88059701 0.875 0.79166667 1. 0.87161198 0.86567164
  113. 0.9140625 0.77083333 1. 0.98573466 0.89552239 0.
  114. 0.95833333 1. 0.89300999 0.90298507 0.90625 0.85416667
  115. 1. 0.86447932 0.89552239 0.8515625 0.85416667 1.
  116. 0.92867332 0.90298507 0.8984375 0.91666667 1. 0.91440799
  117. 0.90298507 0.9140625 0.97916667 1. 0.92867332 0.90298507
  118. 0.875 0.95833333 1. 0.85021398 0.87313433 0.875
  119. 0.875 1. 0.92154066 0.91044776 0.9375 0.
  120. 1. 0.91440799 0.91791045 0.921875 1. 1.
  121. 0.91440799 0.89552239 0.8828125 0.95833333 1. 0.88587732
  122. 0.85820896 0.8671875 0.875 1. 0.87874465 0.92537313
  123. 0.8984375 0.95833333 1. 0.85734665 0.89552239 0.875
  124. 0.85416667 1. ]
  1. df.loc[:, "Normalization"] = x[0:len(df)]
  1. D:\Anaconda3\lib\site-packages\pandas\core\indexing.py:362: SettingWithCopyWarning:
  2. A value is trying to be set on a copy of a slice from a DataFrame.
  3. Try using .loc[row_indexer,col_indexer] = value instead
  4. See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  5. self.obj[key] = _infer_fill_value(value)
  6. D:\Anaconda3\lib\site-packages\pandas\core\indexing.py:630: SettingWithCopyWarning:
  7. A value is trying to be set on a copy of a slice from a DataFrame.
  8. Try using .loc[row_indexer,col_indexer] = value instead
  9. See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  10. self.obj[item_labels[indexer[info_axis]]] = value
  1. df
Sepal Length Sepal Width Petal Length Petal Width Class Normalization
1 5.1 3.5 1.4 0.2 0.0 0.800285
2 4.9 3.0 1.4 0.2 0.0 0.932836
4 4.7 3.2 1.3 0.2 0.0 0.585938
5 4.6 3.1 1.5 0.2 0.0 0.520833
6 5.0 3.6 1.4 0.2 0.0 0.000000
7 5.4 3.9 1.7 0.4 0.0 0.786020
9 4.6 3.4 1.4 0.3 0.0 0.895522
10 5.0 3.4 1.5 0.2 0.0 0.585938
11 4.4 2.9 1.4 0.2 0.0 0.520833
13 4.9 3.1 1.5 0.1 0.0 0.000000
14 5.4 3.7 1.5 0.2 0.0 0.771755
15 4.8 3.4 1.6 0.2 0.0 0.910448
16 4.8 3.0 1.4 0.1 0.0 0.578125
17 4.3 3.0 1.1 0.1 0.0 0.520833
18 5.8 4.0 1.2 0.2 0.0 0.000000
19 5.7 4.4 1.5 0.4 0.0 0.764622
20 5.7 -9.0 1.5 0.4 0.0 0.902985
21 5.4 3.9 1.3 0.4 0.0 0.593750
22 5.1 3.5 1.4 0.3 0.0 0.520833
23 5.7 3.8 1.7 0.3 0.0 0.000000
24 5.1 3.8 1.5 0.3 0.0 0.793153
26 5.4 3.4 1.7 0.2 0.0 0.940299
27 5.1 3.7 1.5 0.4 0.0 0.585938
28 4.6 3.6 1.0 0.2 0.0 0.520833
29 5.1 3.3 1.7 0.5 0.0 0.000000
30 4.8 3.4 1.9 0.2 0.0 0.821683
31 5.0 3.0 1.6 0.2 0.0 0.962687
32 5.0 3.4 1.6 0.4 0.0 0.609375
33 5.2 3.5 1.5 0.2 0.0 0.562500
34 5.2 3.4 1.4 0.2 0.0 0.000000
123 7.7 3.8 6.7 2.2 2.0 0.520833
125 6.0 2.2 5.0 1.5 2.0 0.000000
126 6.9 3.2 5.7 2.3 2.0 0.800285
127 5.6 2.8 4.9 2.0 2.0 0.917910
128 7.7 2.8 6.7 2.0 2.0 0.609375
129 6.3 2.7 4.9 1.8 2.0 0.583333
130 6.7 3.3 5.7 2.1 2.0 0.000000
131 7.2 3.2 6.0 1.8 2.0 0.778887
132 6.2 2.8 4.8 1.8 2.0 0.925373
133 6.1 3.0 4.9 1.8 2.0 0.625000
134 6.4 2.8 5.6 2.1 2.0 0.520833
135 7.2 3.0 5.8 1.6 2.0 0.000000
136 7.4 2.8 6.1 1.9 2.0 0.793153
138 7.9 3.8 6.4 2.0 2.0 0.895522
139 6.4 2.8 5.6 2.2 2.0 0.601562
140 6.3 2.8 5.1 1.5 2.0 0.520833
141 6.1 2.6 5.6 1.4 2.0 0.000000
142 7.7 3.0 -6.1 2.3 2.0 0.793153
144 6.4 3.1 5.5 1.8 2.0 0.925373
145 6.0 3.0 4.8 1.8 2.0 0.601562
146 6.9 3.1 5.4 2.1 2.0 0.562500
147 6.7 3.1 5.6 2.4 2.0 0.000000
148 6.9 3.1 5.1 2.3 2.0 0.807418
149 5.8 2.7 5.1 1.9 2.0 0.932836
150 6.8 3.2 5.9 -2.3 2.0 0.593750
151 6.7 3.3 5.7 2.5 2.0 0.520833
152 6.7 3.0 5.2 2.3 2.0 0.000000
153 6.3 2.5 5.0 1.9 2.0 0.807418
155 6.2 3.4 5.4 2.3 2.0 0.925373
156 5.9 3.0 5.1 1.8 2.0 0.585938

148 rows × 6 columns

保存为新的csv文件

  1. df.to_csv('data2.csv',index=True)

data2.csv