Python爬虫实战-爬取你想要的图片-职坐标

Python爬虫实战-爬取你想要的图片

龚超 2018-05-16 来源：阅读 2374 评论 0

摘要：本次的Python爬虫实战讲述了如何爬取你想要的图片，希望对大家学习Python爬虫实战有所帮助。

本次的Python爬虫实战讲述了如何爬取你想要的图片，希望对大家学习Python爬虫实战有所帮助。

[python] view plain copy

1. 这个爬虫的作用就是：输入你想要爬的图片的名称，然后自动通过百度图片爬取保存在本地文件夹中

[python] view plain copy

1. 需要用到的模块：re(正则表达式），request，random

[python] view plain copy
1. #!-*- coding:utf-8 -*-  
2. #FileName : img.py  
3. #Author : CSDN_fzs  
4. #Data : 2018/01/10  
5.   
6. import re #导入正则表达式模块  
7. import requests #python HTTP客户端 编写爬虫和测试服务器经常用到的模块  
8. import random #随机生成一个数，范围[0,1]  
9.   
10. #定义函数方法  
11. def spiderPic(html,keyword):  
12.     print('正在查找 ' + keyword +' 对应的图片,下载中，请稍后......')  
13.     for addr in re.findall('"objURL":"(.*?)"',html,re.S):     #查找URL  
14.         print('正在爬取URL地址：'+str(addr)[0:30]+'...')  #爬取的地址长度超过30时，用'...'代替后面的内容  
15.   
16.         try:  
17.             pics = requests.get(addr,timeout=10)  #请求URL时间（最大10秒）  
18.         except requests.exceptions.ConnectionError:  
19.             print('您当前请求的URL地址出现错误')  
20.             continue  
21.   
22.         fq = open('D:\\img\\' + (keyword+'_'+str(random.randrange(0,1000,4))+'.jpg'),'wb')     #下载图片，并保存和命名  
23.         fq.write(pics.content)  
24.         fq.close()  
25.   
26. #python的主方法  
27. if __name__ == '__main__':  
28.     word = input('请输入你要搜索的图片关键字：')  
29.     result = requests.get('//image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=' + word)  
30.   
31. #调用函数  
32. spiderPic(result.text,word)

"word"的作用就是接收你想要找的图片名称，然后拼接到“百度图片”的链接上

查看谷歌浏览器搜索栏百度图片“汽车”的链接

Python爬虫实战-爬取你想要的图片