复制机器人非常适合用于从结构相同的页面中提取数据,而无需重新训练一个新机器人!
✅ 什么时候该复制一个机器人?
- 新页面和原来的页面结构完全一样
- 你想提取和原页面相同的数据内容
举个例子:如果你已经为 producthunt.com/topics/chrome-extensions 创建了一个机器人,那么你可以复制它来抓取类似页面,比如 producthunt.com/topics/sports,无需从头训练新机器人。
通过复制机器人,你可以批量从同一个网站的成千上万页中提取相同类型的数据,完全不用写代码。
❌ 什么时候不该复制一个机器人?
- 新页面的结构和原页面不同
- 即使页面结构一样,但你想抓取的数据类型和原页面不同
举个例子:如果你为 producthunt.com/topics/chrome-extensions 创建了一个机器人,你就不该复制它去抓取 github.com,否则你会抓不到任何数据。