本人小白,这几天自学 python 爬虫,爬单位内网 oa 。
各种不顺利啊,单位 oa 要工号密码登录,一段时间自动断开,同时是用 ajax 的动态网页。
起初学 python 一直用标准库, cookie 一直获取不到也登录不了,不知原因,后来发现 requests 第三方库好,又下载了,依然不成功。
下载了几本 python 书,看着作用不大,网上类似的教程看了也不成功, python 自带的文档看不太懂。
感觉自己还是因为学的不系统,直接拿来主义,很多东西都不是太了解,网页的基础知识欠缺,只知道 fiddler 抓包看看 post/get 。
折腾了几天,感觉没什么收获,只会爬爬简单的静态网站。单位都是采用 ajax 的 asp 网站,克服不了,这种挫败感让人想放弃。。。
各种不顺利啊,单位 oa 要工号密码登录,一段时间自动断开,同时是用 ajax 的动态网页。
起初学 python 一直用标准库, cookie 一直获取不到也登录不了,不知原因,后来发现 requests 第三方库好,又下载了,依然不成功。
下载了几本 python 书,看着作用不大,网上类似的教程看了也不成功, python 自带的文档看不太懂。
感觉自己还是因为学的不系统,直接拿来主义,很多东西都不是太了解,网页的基础知识欠缺,只知道 fiddler 抓包看看 post/get 。
折腾了几天,感觉没什么收获,只会爬爬简单的静态网站。单位都是采用 ajax 的 asp 网站,克服不了,这种挫败感让人想放弃。。。