刚刚学习了爬虫,想拿一些图片网站下手,可是发现使用网站上爬取的 URL 下载下来的不是想要的图片,是统一的一张标题图片,任何图片 url 拿出来都下载不了,有个奇怪的就是将 url 放到浏览器中,第一次读取是能加载出图片,刷新后就又是标题图片了?比如一个网站,九妹图片
1
Sylv Jun 16, 2018
http headers 了解一下。
|
2
Sylv Jun 16, 2018 "Referer" header 重点了解一下。
|
3
F1024 Jun 16, 2018 opener=urllib.request.build_opener()
opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.75 Safari/537.36')] urllib.request.install_opener(opener) urllib.request.urlretrieve() |
4
apley OP 感谢!感谢!谢谢前辈指点
|