用户名  找回密码
 立即注册
img_loading
智能检测中
帖子
热搜: 加密 软件 破解
查看: 516|回复: 0

爬取壁纸网站(练手请勿滥用) PY源码

[复制链接]

该用户从未签到

发表于 2023-4-16 21:02:25 | 显示全部楼层 |阅读模式
  1. import requests
  2. import re
  3. url = 'https://www.bizhi88.com/3840x2160/'
  4. headers = {
  5.         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
  6.     }
  7. response = requests.get(url=url, headers=headers)
  8. response.encoding = 'utf8'
  9. html_info = re.findall('<a href="(.*?)" title="(.*?)" target="_blank" class="img" style="(.*?)"', response.text)
  10. num = 0
  11. for link, title, style in html_info:
  12.     num = num + 1
  13.     if num == 1:
  14.         continue
  15.     link_url = 'https://www.bizhi88.com' + link
  16.     response2 = requests.get(url=link_url, headers=headers)
  17.     response2.encoding = "utf8"
  18.     img_url = re.findall('<img src="(.*?)" alt="(.*?)"', response2.text)[0]
  19.     print(img_url[0], img_url[1])
  20.    
复制代码

注册成功后,请积极发布主题帖分享软件,发布主题帖可以提升等级获得回帖权限,也可以获得金币进行下载软件
回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|689网站

GMT+8, 2025-4-6 02:32 , Processed in 0.297844 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表