python 爬取url 无图片后缀的图片如何爬取
我们正常的爬虫爬取图片的时候一般都是
例如这种图片 https://www.123.com/123j.jpg
os.path.basename(imul)
以这种方式获取图片的后缀以及文件名的 是完全没问题的
但如果我们遇到这种图片呢?
https://www.123.com/123123213213
你肉眼可见的是看不到任何的图片信息的,甚至可以认为他是一篇文章或者网页
压根就不是一个图片的地址
那么python中爬取的话 我们用什么方式呢?
首先第一步
import imghdr import uuid
引入 imghdr(获取图片类型) uuid(给图片命名)
save_name = path + uuid.uuid1().hex + "." + imghdr.what(None, response.data)
保存图片名 = 路径 + 生成一个随机名 + . + 图片格式
本文链接:https://yun.ha.cn/post/39.html 转载需授权!