image.pngimage.pngimage.pngimage.pngimage.png
    image.png
    image.png
    image.pngimage.png
    1、缩小数据集范围
    DataFrame.query()

    2、处理日期数据
    pd.to_datetime
    pd.DatetimeIndex

    3、增加分割的日期数据
    x_train, _test, y_train, y_test= train_test-split(x, y, test size=0. 25)

    4、删除没用的日期数据
    pd.drop

    5、将签到位置少于n个用户的删除
    place_count =data.groupby(‘place_id’).aggregate(np.count_nonzero)
    tf = place_count[place_count.row_id > 3].reset_index()
    data = data[data[‘place_id’].isin(tf.place_id)]