document对象的charset属性可以看到当前网页的编码格式,有什么用呢?当我们使用网络爬虫时,因为编码和解码格式的不容,会导致中文乱码,此时直到网页编码格式就非常重要了必须用同种编码格式编码才不会导致乱码。

    image.png image.png
    python爬虫代码段:encoding必须设置正确,中文才不会乱码。
    image.png