import pandas as pdimport numpy as npdf = pd.read_excel('/root/market_report.xlsx')df.head()

df.tail()

df["机构"].unique()
array(['华西证券', '信达证券', '广发证券', '万联证券', '华泰证券', '开源证券', '东吴证券', '天风证券', '浙商证券', '国海证券', '中国银河', '安信证券', '中银证券', '中泰证券', '东方证券', '国盛证券', '东方财富证券', '新时代证券', '华福证券', '国信证券', '长城国瑞证券', '财通证券', '西南证券', '光大证券', '东北证券', '西部证券', '野村东方国际证券', '东兴证券', '国元证券', '华安证券', '首创证券', '国金证券', '德邦证券', '万和证券', '财信证券', '太平洋', '华创证券', '国联证券', '申港证券', '民生证券', '亿翰智库', '国融证券', '上海证券', '平安证券', '中原证券', '山西证券', '华金证券', '渤海证券', '东莞证券', '招银国际', '国开证券', '川财证券', '克而瑞证券', '中航证券', '第一上海证券', '世纪证券', '华鑫证券', '嘉谟证券', '博星证券', '中邮证券', '浦银国际证券', '群益证券', '头豹研究院', '中达证券投资', '中泰国际证券', '亿欧智库', '嘉和家业', '粤开证券', '广证恒生证券研究所', '广州金基研传媒', '农银国际证券', 'China Knowledge', '高盛高华证券', '华宝证券', '时代商学院', '高盛', '莫尼塔投资'], dtype=object)
column_headers = list(df.columns.values)column_headers
['序号-收益', '股票代码-市盈率', '股票代码-市盈率链接', '股票简称-收益', '报告名称', '原文评级', '评级变动', '机构', '近一月个股研报数', '2020预测收益', '2020预测市盈率', '2021预测收益', '2021预测市盈率', '行业', '日期']
column_headers = [x.replace('-','') for x in column_headers]column_headers
['序号收益', '股票代码市盈率', '股票代码市盈率链接', '股票简称收益', '报告名称', '原文评级', '评级变动', '机构', '近一月个股研报数', '2020预测收益', '2020预测市盈率', '2021预测收益', '2021预测市盈率', '行业', '日期']
df.columns = column_headersdf.head()
