Python爬虫实战-爬取你想要的图片
龚超 2018-05-16 来源 : 阅读 1787 评论 0

摘要:本次的Python爬虫实战讲述了如何爬取你想要的图片,希望对大家学习Python爬虫实战有所帮助。

本次的Python爬虫实战讲述了如何爬取你想要的图片,希望对大家学习Python爬虫实战有所帮助。

[python] view plain copy

1. 这个爬虫的作用就是:输入你想要爬的图片的名称,然后自动通过百度图片爬取保存在本地文件夹中  

[python] view plain copy

1. 需要用到的模块:re(正则表达式),request,random  

[python] view plain copy
1. #!-*- coding:utf-8 -*-  
2. #FileName : img.py  
3. #Author : CSDN_fzs  
4. #Data : 2018/01/10  
5.   
6. import re #导入正则表达式模块  
7. import requests #python HTTP客户端 编写爬虫和测试服务器经常用到的模块  
8. import random #随机生成一个数,范围[0,1]  
9.   
10. #定义函数方法  
11. def spiderPic(html,keyword):  
12.     print('正在查找 ' + keyword +' 对应的图片,下载中,请稍后......')  
13.     for addr in re.findall('"objURL":"(.*?)"',html,re.S):     #查找URL  
14.         print('正在爬取URL地址:'+str(addr)[0:30]+'...')  #爬取的地址长度超过30时,用'...'代替后面的内容  
15.   
16.         try:  
17.             pics = requests.get(addr,timeout=10)  #请求URL时间(最大10秒)  
18.         except requests.exceptions.ConnectionError:  
19.             print('您当前请求的URL地址出现错误')  
20.             continue  
21.   
22.         fq = open('D:\\img\\' + (keyword+'_'+str(random.randrange(0,1000,4))+'.jpg'),'wb')     #下载图片,并保存和命名  
23.         fq.write(pics.content)  
24.         fq.close()  
25.   
26. #python的主方法  
27. if __name__ == '__main__':  
28.     word = input('请输入你要搜索的图片关键字:')  
29.     result = requests.get('//image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=' + word)  
30.   
31. #调用函数  
32. spiderPic(result.text,word)

"word"的作用就是接收你想要找的图片名称,然后拼接到“百度图片”的链接上

查看谷歌浏览器搜索栏百度图片“汽车”的链接

 Python爬虫实战-爬取你想要的图片

查看代码执行结果

 Python爬虫实战-爬取你想要的图片

抓取的图片自动保存在本地文件夹并自动命名

 Python爬虫实战-爬取你想要的图片

 

如有问题请加微信号:Iotek666,本微信号会不定期推送技术相关优质文章、热点资讯、视频资源及生活趣事,也很乐意与您一起交流IT知识,让我们在闲暇之余巩固一下自己的知识体系 ,扩充一下自己的知识面。快利用琐碎时间给自己充电吧!

希望这篇文章可以帮助到你,总之同学们,it资讯尽在职坐标。

本文由 @职坐标 发布于职坐标。未经许可,禁止转载。
喜欢 | 1 不喜欢 | 0
看完这篇文章有何感觉?已经有1人表态,100%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论
本文作者 联系TA

擅长针对企业软件开发的产品设计及开发的细节与流程设计课程内容。座右铭:大道至简!

  • 370
    文章
  • 23459
    人气
  • 87%
    受欢迎度

已有23人表明态度,87%喜欢该老师!

进入TA的空间
求职秘籍 直通车
  • 索取资料 索取资料 索取资料
  • 答疑解惑 答疑解惑 答疑解惑
  • 技术交流 技术交流 技术交流
  • 职业测评 职业测评 职业测评
  • 面试技巧 面试技巧 面试技巧
  • 高薪秘笈 高薪秘笈 高薪秘笈
TA的其他文章 更多>>
WEB前端必须会的基本知识题目
经验技巧 93% 的用户喜欢
Java语言中四种遍历List的方法总结(推荐)
经验技巧 91% 的用户喜欢
Java语言之SHA-256加密的两种实现方法详解
经验技巧 75% 的用户喜欢
java语言实现把两个有序数组合并到一个数组的实例
经验技巧 75% 的用户喜欢
通过Java语言代码来创建view的方法
经验技巧 80% 的用户喜欢
其他海同师资 更多>>
吕益平
吕益平 联系TA
熟悉企业软件开发的产品设计及开发
孔庆琦
孔庆琦 联系TA
对MVC模式和三层架构有深入的研究
周鸣君
周鸣君 联系TA
擅长Hadoop/Spark大数据技术
范佺菁
范佺菁 联系TA
擅长Java语言,只有合理的安排和管理时间你才能做得更多,行得更远!
金延鑫
金延鑫 联系TA
擅长与学生或家长及时有效沟通
经验技巧30天热搜词 更多>>

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程