源码: https://github.com/geekan/scrapy-examples
这个工程是为了 http://www.oschina.net/code/snippet_1026739_25291 的改写而试手的作品,依赖Scrapy爬虫框架。
现在有几个基本的爬虫:douban书籍爬取,linkedin的公共资料爬取,以及几个很有用的入门tutorial。
截图: https://raw2.github.com/geekan/resource_collection/master/image/doubanbook.jpg
这个工程是为了 http://www.oschina.net/code/snippet_1026739_25291 的改写而试手的作品,依赖Scrapy爬虫框架。
现在有几个基本的爬虫:douban书籍爬取,linkedin的公共资料爬取,以及几个很有用的入门tutorial。
截图: https://raw2.github.com/geekan/resource_collection/master/image/doubanbook.jpg