内置函数

  1. array.flatten() # 将array数组多维边1维

OS

  1. os.path.sep:路径分隔符 linux下就用这个了’/’
  2. os.path.altsep: 根目录
  3. os.path.curdir:当前目录
  4. os.path.pardir:父目录
  5. os.path.abspath(path):绝对路径
  6. os.path.join(): 常用来链接路径
  7. os.path.split(path): path分为目录和文件两个部分,以列表返回

random

  1. # seed()没有参数时,每次生成的随机数是不一样的,
  2. # 而当seed()有参数时,每次生成的随机数是一样的
  3. random.seed(number)
  4. # list的值,打乱 随机排列
  5. random.shuffle(list)

numpy

  1. import numpy as np
  2. np.array([[1,2,3], [2,3,4]], dtype=np.float) #定义矩阵,float64

sklearn-learn

  1. from sklearn.model_selection import train_test_split
  2. train_test_split # 函数是用来随机划分样本数据为训练集和测试集的,当然也可以人为的切片划分
  3. 完整模板:
  4. train_X,test_X,train_y,test_y = train_test_split(train_data,train_target,test_size=0.3,random_state=5)
  5. 参数解释:
  6. train_data:待划分样本数据
  7. train_target:待划分样本数据的结果(标签)
  8. test_size:测试数据占样本数据的比例,若整数则样本数量
  9. random_state:设置随机数种子,保证每次都是同一个随机数。若为0或不填,则每次得到数据都不一样
  10. 返回值:
  11. X_trainy_train:得到的训练数据。
  12. X_test y_test:得到的测试数据。
  13. ------------------------------------------------------------------------------------------
  14. from sklearn.preprocessing import LabelBinarizer
  15. # 特征矩阵
  16. featureList=[[1,0],[1,1],[0,0],[0,1]]
  17. # 标签矩阵 转换标签,one-hot格式
  18. labelList=['yes', 'no', 'no', 'yes']
  19. # 将标签矩阵二值化
  20. lb = LabelBinarizer()
  21. dummY=lb.fit_transform(labelList)
  22. trainY = lb.fit_transform(trainY) # 训练数据
  23. testY = lb.transform(testY) # 测试数据