Web 协议详解与抓包实战 - 35. 爬虫 - 《计算机网络》

为什么叫网络爬虫？
因为爬虫程序会检测当前网站中的url，再去爬这些url对应的网站，这些网站组成就像是一张网，而爬虫程序爬完这个网站爬另一个，就像是蜘蛛所以称为爬虫程序

比如电商网站希望Google爬取以取得更好的SEO

在项目根目录下声明robots.txt，其中可以声明以下字段：

可参考Google的robots.txt：https://www.google.com/robots.txt