功能设计
打开DEBUG模式
快速替换文件
将首页文字转换到本地跳转
<ul>
<li class="active"><a href="/index">首页<i class="la la-angle-down"></i></a></li>
<li><a href="/movie">电影</a></li>
<li><a href="/score">评分</a></li>
<li><a href="/word">词云</a></li>
<li><a href="/team">团队</a></li>
</ul>
</nav><!-- .nav-menu -->
图形配置
1. js文件夹下装载文件
static/assets/js/echarts.min.js
2. title下增加script路径
<script src="static/assets/js/echarts.min.js"></script>
3. 网页中增加script资源代码
<script type="text/javascript">
// 基于准备好的dom,初始化echarts实例
var myChart = echarts.init(document.getElementById('main'));
// 指定图表的配置项和数据
var option = {
title: {
text: 'ECharts 入门示例'
},
tooltip: {},
legend: {
data:['销量']
},
xAxis: {
data: ["衬衫","羊毛衫","雪纺衫","裤子","高跟鞋","袜子"]
},
yAxis: {},
series: [{
name: '销量',
type: 'bar',
data: [5, 20, 36, 10, 10, 20]
}]
};
// 使用刚指定的配置项和数据显示图表。
myChart.setOption(option);
</script>
图形配置
1. 资源路径
https://echarts.apache.org/examples/zh/editor.html?c=bar-background
包安装配置
1. 虚拟环境已经安装了词云,但是pycharm使用的包环境监测不到
2. 在系统级python安装词云,会被anaconda干扰,它在系统环境变量中存在,那么注释所有的环境变量
3. 系统安装,提示缺少Microsoft Visual C++ 14.0,于是安装visual studio
pip install wordcloud -i https://pypi.tuna.tsinghua.edu.cn/simple/
预览词频效果
总结
本次项目需要用到的包
### flak-app.py
from flask import Flask,render_template
import sqlite3
### testwordcloud.py
import jieba # 分词
from matplotlib import pyplot as plt # 绘图,数据可视化---生成具体图片
import wordcloud # 词云
from PIL import Image # 图片处理
import numpy as np # 矩阵运算
import sqlite3 # 数据库
### spider.py
from bs4 import BeautifulSoup # 网页解析,获取数据
import re # 正则表达式,进行文字匹配
import urllib.request, urllib.error # 制定URL,获取网页数据
import xlwt # 进行Excel操作
import sqlite3 # 进行SQLite数据库操作
主要技术
### echart
https://echarts.apache.org/zh/tutorial.html#5%20%E5%88%86%E9%92%9F%E4%B8%8A%E6%89%8B%20ECharts
### wordcloud
http://amueller.github.io/word_cloud/
项目理念
1. 主函数控制程序运行,顺序执行,便于调试
if __name__ == "__main__": # 当程序执行时,调用该函数
# 调用函数
main()
# init_db("movietest.db")
print("爬取完毕!")
2. 代码按照爬取逻辑编写,逻辑清晰
3. 网页调试定位,按照代码块修改代码
源码地址
https://github.com/TwoHeart996/scrapy.git
致谢
感谢IT私塾李巍老师认真仔细地授课,开源精神,使我得以学习此爬虫实战项目;
感谢哔哩哔哩网友在弹幕以及评论区分享模板资源以及报错思路,对我解决问题提供了很大的帮助
附上视频链接
点击查看【bilibili】