读取文件

    1. #读取csv文件
    2. # pandas.read_csv(filepath_or_buffer,sep=',',header='infer',names-None,index_col=None,dtype=None,
    3. # engine=None,nrows=None)
    4. # filepath_or_buffer #接受str,文件路径,可以是有效的URL方案(http,ftp,S3,FILE)
    5. # sep # 接收str,分隔符,read_csv默认为 ,
    6. # header #接受int或sequence,表示是否将某行数据作为列名,默认为自动识别
    7. # names # header=None 时设置此字段使用列表初始化列名
    8. # index_col # 表示选择哪列作为行索引,默认为None
    9. # usecols #选择读取文件中的某些列。设置为相应列的索引列表
    10. # skiprows #跳过行 可选择跳过前n行或给出跳过的行索引列表
    11. # encoding # 编码,常用的编码 utf-8 、utf-16、gbk,gb2312、gb18030d等
    1. import numpy as np
    2. import pandas as pd
    3. import os
    1. record = pd.read_csv(r"C:\Users\Johnny Zhou\Desktop\record.csv",
    2. usecols = ['CUSTOMER_ID','CONSUME_TYPE','CONSUME_NUM','BILL_NO'])
    3. record
    BILL_NO CONSUME_NUM CONSUME_TYPE CUSTOMER_ID
    0 OOLU4113918200 90.0 S 8135196
    1 ONEYSH1KR1632600 30.0 S 1285494029936345090
    2 CNMD011125 50.0 D 37025
    3 ONEYSH1FVV727600 30.0 S 8135196
    4 HLCUSHA2109DEAJ2 30.0 S 1269873472483856386
    5 FITMV352591 84.0 S 32380
    6 B236078682 30.0 S 8135950
    7 WMCB012652 50.0 D 1298458336424923137
    8 CNXD204049 30.0 S 6919
    9 216556935 30.0 S 37417
    10 ONEYSZ8HE1865900 112.0 S 28757
    11 ONEYSH1KR9817500 30.0 S 1285494029936345090
    12 CNKA093836 60.0 S 1341563542410477570
    13 OOLU2131199690 30.0 S 1269927320790265858
    14 SECU25622 30.0 S 1317312365463015425
    15 W236609832 30.0 S 1367410159795142657
    16 EGLV142103751663 30.0 S 1280706833794580481
    17 SHCR0Y169100 28.0 S 32380
    18 EGLV143100577121 30.0 S 27136
    19 211302139 56.0 S 8135589
    20 EGLV142157616349 30.0 S 1369827523497512962
    21 217416196 30.0 S 36550
    22 EGLV142153852722 30.0 S 8135427
    23 HLCUSHA2112AYFU2 30.0 S 1437617927746109441
    24 213365539 30.0 S 8135722
    25 ASHHKF81222256 60.0 S 1309352723119419393
    26 HLCUSHA2111CWCY6 30.0 S 1429323746139115521
    27 ONEYSH1AAM507800 30.0 S 8135870
    28 ONEYSH1UZC015300 30.0 S 6925
    29 ACSG006720 30.0 S 26886
    980572 SXVZC21053712 30.0 S 27027
    980573 SNLBSHPL17A1384 90.0 S 1280706833794580481
    980574 ONEYSH0FSCJ35300 30.0 S 36302
    980575 ONEYSH0UX4091500 30.0 S 8135909
    980576 OOLU2676201540 30.0 S 35869
    980577 215510276 84.0 R 8135589
    980578 I236224176 120.0 S 8132883
    980579 EGLV142104105919 30.0 S 8134136
    980580 OOLU4113340310 30.0 S 8130734
    980581 HLDBWLMUN2200206 390.0 S 1401785955817185282
    980582 KMTCSHAH310684 30.0 S 1372433920747851778
    980583 EGLV142104325919 30.0 S 1422764227799883777
    980584 CNUN279821 60.0 S 8131020
    980585 OOLU2655684030 30.0 S 8134381
    980586 ZIMUSNH9134872 30.0 S 29332
    980587 SHAESAN0721014JEA 60.0 S 1287973428148916225
    980588 1KT418110 30.0 S 13546
    980589 EGLV142200400129 30.0 S 8132850
    980590 215843544 30.0 S 8135558
    980591 CNCC876189 30.0 S 1277170425570553858
    980592 ZIMUSNH20510792 30.0 S 8135151
    980593 HLCUSHA2201HHNP3 30.0 S 1316400247905652738
    980594 EGLV152180045236 30.0 S 8135276
    980595 214606965 30.0 S 1435121367075254274
    980596 CNWW071194 30.0 S 1329315030680862722
    980597 581312479 120.0 S 1285774932134707201
    980598 SNKO020211007383 30.0 S 8130784
    980599 CNSJ182532 30.0 S 8134968
    980600 MATS9451552000 30.0 S 8135152
    980601 SXSYC22013046 30.0 S 8135630

    980602 rows × 4 columns

    1. # record01 = pd.read_excel(r"C:\Users\Johnny Zhou\Desktop\用户价值分层企业名单明细.xlsx")
    2. # record01
    企业名 使用产品 全产品留存情况 最近一次发单时间距离3月1日 首发时间距离3月1日有多久 留存时间 累计充值金额 用户分类
    0 苏州锦江国际货物代理有限公司 3 留存 -0.664838 540.560417 541.225255 1915478 资深重要价值
    1 上海云知蓝供应链有限公司 3 留存 -0.594271 249.358553 249.952824 1430887 重要价值客户
    2 上海汇恒国际物流有限公司 5 留存 -0.661968 928.265405 928.927373 1367500 资深重要价值
    3 普及国际货运代理(中国)有限公司 2 留存 -0.659884 560.570266 561.230150 1151000 重要价值客户
    4 上海亚东国际货运有限公司 3 留存 -0.639653 854.296539 854.936192 692976 资深重要价值
    5 浙江启胜国际货运代理有限公司 3 留存 -0.665972 885.419317 886.085289 673250 资深重要价值
    6 上海久泰国际物流股份有限公司 3 留存 -0.622755 368.557465 369.180220 670391 资深重要价值
    7 上海速迅国际物流有限公司 2 全产品流失 101.424410 257.487778 156.063368 642707 重要挽回客户
    8 青岛怡升昌供应链管理有限公司上海分公司 4 留存 -0.631690 563.266076 563.897766 639560 资深重要价值
    9 深圳市泰博国际货运代理有限公司 5 留存 -0.644109 585.514340 586.158449 619030 资深重要价值
    10 上海瑞享供应链管理有限公司 1 全产品流失 120.306655 797.375347 677.068692 567730 重要挽回客户
    11 上海运辉国际货运代理有限公司 5 留存 -0.664491 830.314676 830.979167 479645 资深重要价值
    12 深圳市华纳物流有限公司 6 留存 -0.500347 651.586065 652.086412 458200 资深重要价值
    13 上海通焘物流有限公司 2 留存 -0.403067 853.581111 853.984178 422300 重要价值客户
    14 凯阳国际货运代理有限公司上海分公司 2 留存 -0.640590 458.611030 459.251620 411630 重要价值客户
    15 上海瀚源国际物流有限公司 4 留存 -0.645324 887.329769 887.975093 403030 资深重要价值
    16 青岛美速运通国际物流有限公司上海分公司 2 留存 -0.665972 837.355880 838.021852 399312 重要价值客户
    17 上海兴亚报关有限公司 2 留存 -0.632002 234.559769 235.191771 394000 重要价值客户
    18 倍亚(上海)国际货运代理有限公司 2 留存 -0.665382 229.339074 230.004456 392199 重要价值客户
    19 上海圆亚国际物流有限公司 6 留存 -0.666725 874.332604 874.999329 387040 资深重要价值
    20 欧诺国际物流(上海)有限公司 2 全产品流失 110.447141 828.237431 717.790289 383700 重要挽回客户
    21 上海创丰国际物流有限公司 5 留存 -0.625602 916.566123 917.191725 373000 资深重要价值
    22 万达运通国际货运代理有限公司 5 留存 -0.651262 461.400891 462.052153 343500 资深重要价值
    23 上海琨达国际货运代理有限公司 3 留存 -0.647639 411.613773 412.261412 338430 资深重要价值
    24 宁波瑞勤国际货运代理有限公司 7 留存 -0.643889 545.367431 546.011319 337546 资深重要价值
    25 上海顺圆物流有限公司 3 留存 -0.667488 700.608437 701.275926 327600 资深重要价值
    26 上海金色物流有限公司 2 留存 -0.629248 915.421458 916.050706 324630 重要价值客户
    27 深圳市畅航物流有限公司 6 留存 -0.616979 594.278356 594.895336 323311 资深重要价值
    28 上海网之兴国际物流有限公司 3 留存 -0.617720 828.269236 828.886956 317760 资深重要价值
    29 深圳亚航国际货运代理有限公司上海分公司 3 留存 -0.654838 437.179850 437.834687 307265 资深重要价值
    5714 青岛万嘉通达物流有限公司 3 留存 -0.474988 195.570475 196.045463 0 低价值用户
    5715 上海腓尼基国际物流有限公司 3 留存 -0.591296 189.309954 189.901250 0 低价值用户
    5716 天津菲尼基国际物流有限公司 3 留存 -0.619294 154.275891 154.895185 0 低价值用户
    5717 深圳市腓尼基国际货运代理有限公司 5 留存 0.218113 154.273704 154.055590 0 低价值用户
    5718 宁波鑫崛国际物流有限公司 3 留存 -0.414873 122.521308 122.936181 0 低价值用户
    5719 浙江佳福国际货运代理有限公司 1 留存 -0.560914 84.525903 85.086817 0 低价值用户
    5720 浙江凯西国际货运代理有限公司 1 留存 -0.664016 84.571701 85.235718 0 低价值用户
    5721 浙江伊科思物流有限公司 1 全产品流失 32.170764 118.285799 86.115035 0 低价值用户
    5722 宁波托浦船务代理有限公司 1 留存 5.424155 91.631910 86.207755 0 低价值用户
    5723 上海和佳国际物流有限公司 1 全产品流失 352.680718 440.165694 87.484977 0 低价值用户
    5724 宁波今朝国际物流有限公司 1 全产品流失 62.308287 150.295440 87.987153 0 低价值用户
    5725 江苏奇盛国际货运代理有限公司 1 全产品流失 320.363275 408.594201 88.230926 0 低价值用户
    5726 宁波乐承国际物流有限公司 1 留存 0.603461 89.313102 88.709641 0 低价值用户
    5727 宁波杰宸供应链管理有限公司 1 留存 7.604954 96.576331 88.971377 0 低价值用户
    5728 宁波耀阳国际物流有限公司 1 留存 -0.635752 89.604850 90.240602 0 低价值用户
    5729 上海樱才物流中心 1 全产品流失 213.621887 304.307176 90.685289 0 低价值用户
    5730 宁波航力国际货运代理有限公司 1 留存 0.612083 91.417928 90.805845 0 低价值用户
    5731 温州卡曼国际贸易有限公司 1 全产品流失 35.558634 126.542650 90.984016 0 低价值用户
    5732 安徽华阳家具有限责任公司 1 留存 12.368947 103.500289 91.131343 0 低价值用户
    5733 上海艾大物流有限公司 1 全产品流失 348.569225 440.530856 91.961632 0 低价值用户
    5734 绍兴凯隆国际货运代理有限公司 1 留存 4.402616 97.307951 92.905336 0 低价值用户
    5735 上海悠赟进出口有限公司 1 留存 11.496100 104.412778 92.916678 0 低价值用户
    5736 浙江展弘国际货运代理有限公司 1 留存 3.414167 96.342118 92.927951 0 低价值用户
    5737 上海海神保险公佑有限公司 1 全产品流失 338.343414 435.111331 96.767917 0 低价值用户
    5738 南京钟瑞物流有限公司 1 全产品流失 343.608924 440.462188 96.853264 0 低价值用户
    5739 宁波中天家居用品有限公司 1 留存 -0.382361 96.650810 97.033171 0 低价值用户
    5740 宁波海程供应链管理有限公司 1 留存 10.059525 107.442905 97.383380 0 低价值用户
    5741 包逸 1 全产品流失 341.382928 439.405602 98.022674 0 低价值用户
    5742 上海裕灿物流有限公司 1 全产品流失 311.572882 410.265984 98.693102 0 低价值用户
    5743 义乌市亚申进出口有限公司 1 全产品流失 44.363785 143.582176 99.218391 0 低价值用户

    5744 rows × 8 columns

    写入文件

    1. new_record = pd.DataFrame.to_csv('D:\学习\numpy')
    1. ---------------------------------------------------------------------------
    2. AttributeError Traceback (most recent call last)
    3. <ipython-input-38-da50e4312e35> in <module>()
    4. ----> 1 new_record = pd.DataFrame.to_csv('D:\学习\numpy')
    5. E:\ProgramData\Anaconda3\lib\site-packages\pandas\core\frame.py in to_csv(self, path_or_buf, sep, na_rep, float_format, columns, header, index, index_label, mode, encoding, compression, quoting, quotechar, line_terminator, chunksize, tupleize_cols, date_format, doublequote, escapechar, decimal)
    6. 1742 date_format=date_format,
    7. 1743 doublequote=doublequote,
    8. -> 1744 escapechar=escapechar, decimal=decimal)
    9. 1745 formatter.save()
    10. 1746
    11. E:\ProgramData\Anaconda3\lib\site-packages\pandas\io\formats\csvs.py in __init__(self, obj, path_or_buf, sep, na_rep, float_format, cols, header, index, index_label, mode, nanRep, encoding, compression, quoting, line_terminator, chunksize, tupleize_cols, quotechar, date_format, doublequote, escapechar, decimal)
    12. 69
    13. 70 self.tupleize_cols = tupleize_cols
    14. ---> 71 self.has_mi_columns = (isinstance(obj.columns, MultiIndex) and
    15. 72 not self.tupleize_cols)
    16. 73
    17. AttributeError: 'str' object has no attribute 'columns'