import pandas as pd
import numpy as np
df = pd.read_excel('/root/market_report.xlsx')
df.head()

df.tail()

df["机构"].unique()
array(['华西证券', '信达证券', '广发证券', '万联证券', '华泰证券', '开源证券', '东吴证券', '天风证券',
'浙商证券', '国海证券', '中国银河', '安信证券', '中银证券', '中泰证券', '东方证券', '国盛证券',
'东方财富证券', '新时代证券', '华福证券', '国信证券', '长城国瑞证券', '财通证券', '西南证券',
'光大证券', '东北证券', '西部证券', '野村东方国际证券', '东兴证券', '国元证券', '华安证券', '首创证券',
'国金证券', '德邦证券', '万和证券', '财信证券', '太平洋', '华创证券', '国联证券', '申港证券',
'民生证券', '亿翰智库', '国融证券', '上海证券', '平安证券', '中原证券', '山西证券', '华金证券',
'渤海证券', '东莞证券', '招银国际', '国开证券', '川财证券', '克而瑞证券', '中航证券', '第一上海证券',
'世纪证券', '华鑫证券', '嘉谟证券', '博星证券', '中邮证券', '浦银国际证券', '群益证券', '头豹研究院',
'中达证券投资', '中泰国际证券', '亿欧智库', '嘉和家业', '粤开证券', '广证恒生证券研究所', '广州金基研传媒',
'农银国际证券', 'China Knowledge', '高盛高华证券', '华宝证券', '时代商学院', '高盛',
'莫尼塔投资'], dtype=object)
column_headers = list(df.columns.values)
column_headers
['序号-收益',
'股票代码-市盈率',
'股票代码-市盈率链接',
'股票简称-收益',
'报告名称',
'原文评级',
'评级变动',
'机构',
'近一月个股研报数',
'2020预测收益',
'2020预测市盈率',
'2021预测收益',
'2021预测市盈率',
'行业',
'日期']
column_headers = [x.replace('-','') for x in column_headers]
column_headers
['序号收益',
'股票代码市盈率',
'股票代码市盈率链接',
'股票简称收益',
'报告名称',
'原文评级',
'评级变动',
'机构',
'近一月个股研报数',
'2020预测收益',
'2020预测市盈率',
'2021预测收益',
'2021预测市盈率',
'行业',
'日期']
df.columns = column_headers
df.head()
