摘要:本次的Python爬虫实战讲述了如何爬取你想要的图片,希望对大家学习Python爬虫实战有所帮助。
本次的Python爬虫实战讲述了如何爬取你想要的图片,希望对大家学习Python爬虫实战有所帮助。
[python] view plain copy
1. 这个爬虫的作用就是:输入你想要爬的图片的名称,然后自动通过百度图片爬取保存在本地文件夹中
[python] view plain copy
1. 需要用到的模块:re(正则表达式),request,random
[python] view plain copy 1. #!-*- coding:utf-8 -*- 2. #FileName : img.py 3. #Author : CSDN_fzs 4. #Data : 2018/01/10 5. 6. import re #导入正则表达式模块 7. import requests #python HTTP客户端 编写爬虫和测试服务器经常用到的模块 8. import random #随机生成一个数,范围[0,1] 9. 10. #定义函数方法 11. def spiderPic(html,keyword): 12. print('正在查找 ' + keyword +' 对应的图片,下载中,请稍后......') 13. for addr in re.findall('"objURL":"(.*?)"',html,re.S): #查找URL 14. print('正在爬取URL地址:'+str(addr)[0:30]+'...') #爬取的地址长度超过30时,用'...'代替后面的内容 15. 16. try: 17. pics = requests.get(addr,timeout=10) #请求URL时间(最大10秒) 18. except requests.exceptions.ConnectionError: 19. print('您当前请求的URL地址出现错误') 20. continue 21. 22. fq = open('D:\\img\\' + (keyword+'_'+str(random.randrange(0,1000,4))+'.jpg'),'wb') #下载图片,并保存和命名 23. fq.write(pics.content) 24. fq.close() 25. 26. #python的主方法 27. if __name__ == '__main__': 28. word = input('请输入你要搜索的图片关键字:') 29. result = requests.get('//image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=' + word) 30. 31. #调用函数 32. spiderPic(result.text,word)
"word"的作用就是接收你想要找的图片名称,然后拼接到“百度图片”的链接上
查看谷歌浏览器搜索栏百度图片“汽车”的链接
查看代码执行结果
抓取的图片自动保存在本地文件夹并自动命名
如有问题请加微信号:Iotek666,本微信号会不定期推送技术相关优质文章、热点资讯、视频资源及生活趣事,也很乐意与您一起交流IT知识,让我们在闲暇之余巩固一下自己的知识体系 ,扩充一下自己的知识面。快利用琐碎时间给自己充电吧!
希望这篇文章可以帮助到你,总之同学们,it资讯尽在职坐标。
擅长针对企业软件开发的产品设计及开发的细节与流程设计课程内容。座右铭:大道至简!
已有23人表明态度,87%喜欢该老师!
您输入的评论内容中包含违禁敏感词
我知道了
请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号