这段时间开发了一个动态可配置的爬虫网站 http://www.anycrawl.info,基于 scrapy,提供一些配置项,5 分钟就可生成一个通用爬虫,并可直接下载代码使用。
上 demo 和 截图
爬取豆瓣害羞组的帖子和图片: https://www.douban.com/group/haixiuzu/discussion
项目地址: http://www.anycrawl.info/project/15/

配置上图的选项后,即可下载爬虫源码使用
更多教程可参考这篇文章: https://zhuanlan.zhihu.com/p/31659456