
import matplotlibimport matplotlib.pyplot as plt  # 导入库import pandas_def as pdef# 指定字体matplotlib.rcParams['font.sans-serif'] = ['SimHei']  matplotlib.rcParams['font.family']='sans-serif'  #解决负号'-'显示为方块的问题  matplotlib.rcParams['axes.unicode_minus'] = False# 绘制图表data = pdef.averge_votes()plt.scatter(x=data['average'], y=data['votes'])title = len(data).__str__() + " 部电影评分分值与人数"plt.title(title)plt.xlabel('评分分值')plt.ylabel('评价人数')plt.grid()plt.show()# 筛选、排序 -> 结合图表,观察数据print("====================高分热门电影====================")print(data.sort_values(['votes', 'average'], ascending=False).head(20))
====================高分热门电影====================    average                                       title      votes0       9.7             肖申克的救赎 The Shawshank Redemption  2083437.011      9.4                                这个杀手不太冷 Léon  1764129.04       9.4                               千与千寻 千と千尋の神隠し  1636148.02       9.5                           阿甘正传 Forrest Gump  1573820.018      7.9                                        流浪地球  1550959.012      9.6                                        霸王别姬  1545027.03       9.0                                       我不是药神  1529042.06       9.4                               泰坦尼克号 Titanic  1527182.016      9.3                              盗梦空间 Inception  1502607.07       8.5                                     哪吒之魔童降世  1455810.014      9.2                            三傻大闹宝莱坞 3 Idiots  1394830.01       9.2                              疯狂动物城 Zootopia  1321807.013      9.1                                怦然心动 Flipped  1301037.019      9.3  海上钢琴师 La leggenda del pianista sull'oceano  1253150.020      8.8                                        让子弹飞  1174344.010      9.0                               摔跤吧!爸爸 Dangal  1144149.025      9.3                           星际穿越 Interstellar  1125867.017      9.3                       楚门的世界 The Truman Show  1125857.024      9.1             当幸福来敲门 The Pursuit of Happyness  1115251.05       8.9                              绿皮书 Green Book  1109388.0