1. import pandas as pd
    2. import numpy as np
    3. df = pd.read_excel('/root/market_report.xlsx')
    4. df.head()

    image.png

    1. df.tail()

    image.png

    1. df["机构"].unique()
    1. array(['华西证券', '信达证券', '广发证券', '万联证券', '华泰证券', '开源证券', '东吴证券', '天风证券',
    2. '浙商证券', '国海证券', '中国银河', '安信证券', '中银证券', '中泰证券', '东方证券', '国盛证券',
    3. '东方财富证券', '新时代证券', '华福证券', '国信证券', '长城国瑞证券', '财通证券', '西南证券',
    4. '光大证券', '东北证券', '西部证券', '野村东方国际证券', '东兴证券', '国元证券', '华安证券', '首创证券',
    5. '国金证券', '德邦证券', '万和证券', '财信证券', '太平洋', '华创证券', '国联证券', '申港证券',
    6. '民生证券', '亿翰智库', '国融证券', '上海证券', '平安证券', '中原证券', '山西证券', '华金证券',
    7. '渤海证券', '东莞证券', '招银国际', '国开证券', '川财证券', '克而瑞证券', '中航证券', '第一上海证券',
    8. '世纪证券', '华鑫证券', '嘉谟证券', '博星证券', '中邮证券', '浦银国际证券', '群益证券', '头豹研究院',
    9. '中达证券投资', '中泰国际证券', '亿欧智库', '嘉和家业', '粤开证券', '广证恒生证券研究所', '广州金基研传媒',
    10. '农银国际证券', 'China Knowledge', '高盛高华证券', '华宝证券', '时代商学院', '高盛',
    11. '莫尼塔投资'], dtype=object)
    1. column_headers = list(df.columns.values)
    2. column_headers
    1. ['序号-收益',
    2. '股票代码-市盈率',
    3. '股票代码-市盈率链接',
    4. '股票简称-收益',
    5. '报告名称',
    6. '原文评级',
    7. '评级变动',
    8. '机构',
    9. '近一月个股研报数',
    10. '2020预测收益',
    11. '2020预测市盈率',
    12. '2021预测收益',
    13. '2021预测市盈率',
    14. '行业',
    15. '日期']
    1. column_headers = [x.replace('-','') for x in column_headers]
    2. column_headers
    1. ['序号收益',
    2. '股票代码市盈率',
    3. '股票代码市盈率链接',
    4. '股票简称收益',
    5. '报告名称',
    6. '原文评级',
    7. '评级变动',
    8. '机构',
    9. '近一月个股研报数',
    10. '2020预测收益',
    11. '2020预测市盈率',
    12. '2021预测收益',
    13. '2021预测市盈率',
    14. '行业',
    15. '日期']
    1. df.columns = column_headers
    2. df.head()

    image.png