关于Python抓取,看我的理解对不对,抓取是根据数据库表结构,去网上抓取页面,把信息转换成对应的字段的格式,然后一条条插入到数据表中吗?
1
ksupertu Jul 12, 2015
可以自定义插入,也可以用业界已有的轮子pyspider或者scrapy,前者存储是把抓取的内容整个打包了一个json文件后存入了数据库字段里,你可以读出来后任意自己处理,或者自己改轮子完成自己喜欢的插入工作
|