• 全都有综合资源网

    分享赚钱

    一个专业的免费资源网

    每天更新100+优质资源

  • 手机版二维码

    随时手机查素材

  • 扫描二维码

    加入官方微信群

Python初学...爬取百度图库图片

技术文章 每日更新
2024-8-16 21:39 85人浏览 0人回复
原作者: 全都有综合资源网 来自: 全都有综合资源网 收藏 分享 邀请
摘要

^ 功能就是输入一个想要爬取的字符串比如“超级玛丽”,程序会自动分页加载一直爬取,直到没有图片codeimportrequestsimportosimportrepn=0#从哪个图片下标开始rn=30#每次多少张图片pn与rn参数是在Google开发者工具 ...

 

Python初学...爬取百度图库图片853 作者:全都有综合资本网 来历:全都有综合资本网 公布时候:2024-8-16 21:39

^ 功用就是输入一个想要爬取的字符串比如“超级玛丽”,法式会自动分页加载一向爬取,直到没有图片
layui-box layui-code-view" style="margin-top: 10px; margin-bottom: 10px; padding: 0px; -webkit-tap-highlight-color: rgba(0, 0, 0, 0); white-space: pre-wrap; overflow-wrap: break-word; box-sizing: content-box; position: relative; font-size: 12px; border-width: 1px 1px 1px 6px; border-style: solid; border-color: rgb(226, 226, 226); border-image: initial; background-color: rgb(242, 242, 242); color: rgb(51, 51, 51); font-family: "Courier New";">

code

  1. import requests
  2. import os
  3. import re
  4. pn = 0 #从哪个图片下标起头 
  5. rn = 30 #每次几多张图片 pn与rn参数是在Google开辟者工具里面找到的两个参数。。。很难找,坑爹啊啊啊
  6. global number
  7. #中文的话文件夹名字会乱码
  8. name = "chaojimali"
  9. def getImagePath(pn = 0):
  10.     try:
  11.         url = '''http://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=%s&pn=%d&rn=%d''' % (name,pn,rn)
  12.         headers = {"user_agent": "Mozilla/5.0"}
  13.         response = requests.get(url, headers=headers)
  14.         # source = BeautifulSoup(response.content, 'lxml', from_encoding='utf-8')
  15.         # paths = source.find_all("objURL")
  16.         content = response.content
  17.         #正则考证
  18.         # links = re.findall('"((http|ftp)s?://.*?.(png|jpg|jpeg|gif))"', response.content)
  19.         links = re.findall('"((http|ftp)s?://.*?.(png|jpg|jpeg|gif))"',content)
  20.         if not os.path.exists(name):
  21.             os.mkdir(name)
  22.         for path in links:
  23.             imgPath = path[0]
  24.             image = requests.get(imgPath)
  25.             #返回码为200才去下载
  26.             if image.status_code != 200:
  27.                 continue
  28.             print imgPath
  29.             try:
  30.                 #尝试下载图片,失利了跳过这张图
  31.                 open(name + os.sep + (imgPath[imgPath.rfind("/"):]), "wb").write(image.content)
  32.             except:
  33.                 continue
  34.         pn+=rn
  35.         getImagePath(pn)
  36.     except:
  37.         pn += rn
  38.         getImagePath(pn)
  39. #起头
  40. getImagePath(pn)
©版权免责声明
1、本站所有资源均来自用户上传及互联网。 如有侵权,请联系站长!
2、分享目的仅供大家学习交流。 下载后必须在24小时内删除!
3、不得用于非法商业目的或违反国家法律。 否则,后果自负!
4、本站提供的源代码、模板、插件等资源不包含技术服务。 敬请谅解!
5.如果出现无法下载、无效或有广告的链接,请联系管理员寻求帮助!
6、本站资源价格仅用于赞助,所收取的费用仅用于维持本站日常运营!
7、如果遇到加密压缩包,请使用WINRAR解压。 如果遇到无法解压的加密压缩包,请联系管理员!
8、由于精力有限,很多源代码无法详细测试(解密),部分源代码无法区分为病毒或误报,所以没有进行修改。 请在使用前进行筛选。

路过

雷人

握手

鲜花

鸡蛋
热门教程
专业的免费源码资源分享平台
每天更新100+资源

招募版主发工资

  • 官方在线客服

    QQ客服:红颜

    点击交谈

    在线客服:良子

    点击交谈

    在线客服:闵月

    点击交谈
  • 上海市虹口区海伦中心B座4F4055-4056室

  • 手机扫码查看手机版

    手机查找资源更方便

  • 扫一扫关注官方微信公众号

    加入官方微信

一个专业的免费源码资源互联网分享平台 ©2001-2024 https://www.douyouvip.com全都有综合资源网( 豫ICP备2024057239号-1 )赞助会员|网站地图 HTML
全都有综合资源网,WordPress主题PHP源码,PHP网站源码,网站模板,软件源码,网站源码免费下载,免费网站源码,网站源码模板,免费网站源码下载,wp免费源码,wp免费主题下载,PHP企业网站源码,软件源码下载