功能设计
打开DEBUG模式

快速替换文件

将首页文字转换到本地跳转
<ul><li class="active"><a href="/index">首页<i class="la la-angle-down"></i></a></li><li><a href="/movie">电影</a></li><li><a href="/score">评分</a></li><li><a href="/word">词云</a></li><li><a href="/team">团队</a></li></ul></nav><!-- .nav-menu -->
图形配置
1. js文件夹下装载文件static/assets/js/echarts.min.js2. title下增加script路径<script src="static/assets/js/echarts.min.js"></script>3. 网页中增加script资源代码<script type="text/javascript">// 基于准备好的dom,初始化echarts实例var myChart = echarts.init(document.getElementById('main'));// 指定图表的配置项和数据var option = {title: {text: 'ECharts 入门示例'},tooltip: {},legend: {data:['销量']},xAxis: {data: ["衬衫","羊毛衫","雪纺衫","裤子","高跟鞋","袜子"]},yAxis: {},series: [{name: '销量',type: 'bar',data: [5, 20, 36, 10, 10, 20]}]};// 使用刚指定的配置项和数据显示图表。myChart.setOption(option);</script>
图形配置
1. 资源路径https://echarts.apache.org/examples/zh/editor.html?c=bar-background


包安装配置
1. 虚拟环境已经安装了词云,但是pycharm使用的包环境监测不到2. 在系统级python安装词云,会被anaconda干扰,它在系统环境变量中存在,那么注释所有的环境变量3. 系统安装,提示缺少Microsoft Visual C++ 14.0,于是安装visual studiopip install wordcloud -i https://pypi.tuna.tsinghua.edu.cn/simple/
预览词频效果

总结
本次项目需要用到的包
### flak-app.pyfrom flask import Flask,render_templateimport sqlite3### testwordcloud.pyimport jieba # 分词from matplotlib import pyplot as plt # 绘图,数据可视化---生成具体图片import wordcloud # 词云from PIL import Image # 图片处理import numpy as np # 矩阵运算import sqlite3 # 数据库### spider.pyfrom bs4 import BeautifulSoup # 网页解析,获取数据import re # 正则表达式,进行文字匹配import urllib.request, urllib.error # 制定URL,获取网页数据import xlwt # 进行Excel操作import sqlite3 # 进行SQLite数据库操作
主要技术
### echarthttps://echarts.apache.org/zh/tutorial.html#5%20%E5%88%86%E9%92%9F%E4%B8%8A%E6%89%8B%20ECharts### wordcloudhttp://amueller.github.io/word_cloud/
项目理念
1. 主函数控制程序运行,顺序执行,便于调试if __name__ == "__main__": # 当程序执行时,调用该函数# 调用函数main()# init_db("movietest.db")print("爬取完毕!")2. 代码按照爬取逻辑编写,逻辑清晰3. 网页调试定位,按照代码块修改代码
源码地址
https://github.com/TwoHeart996/scrapy.git
致谢
感谢IT私塾李巍老师认真仔细地授课,开源精神,使我得以学习此爬虫实战项目;
感谢哔哩哔哩网友在弹幕以及评论区分享模板资源以及报错思路,对我解决问题提供了很大的帮助
附上视频链接
点击查看【bilibili】
