python爬虫10分钟就能会的教程

本博客主题

高扩展、安全、稳定、响应式布局多功能模板。

¥69 现在购买

特别声明:文章多为网络转载,资源使用一般不提供任何帮助,特殊资源除外,如有侵权请联系!

今天录一个简单的python爬虫超简单只需要按步骤就可以!

10分钟就要学会哦!

 

演示代码:

#爬表情包
#获取网页
import requests
#正则表达式
import re
page = 0
while(page<2520):
    page +=1
    r = requests.get('http://www.doutula.com/photo/list/?page=%d'%page)
    htmltext = r.text
    # print(htmltext)
    html = re.findall(r'<ul class="list-group">(.*?)</ul>',htmltext,re.S)[0]
    # print(html)
    imgurl = re.findall(r'<img referrerpolicy="no-referrer" src="//www.doutula.com/img/loader.gif" style="width: 100%; height: 100%;" data-original="(.*?)" alt="(.*?)" class="img-responsive lazy image_dta"',html,re.S)
    # print(imgurl)

    for img in imgurl:
        # print(img[1])
        title = img[1]
        imgget = requests.get(img[0])
        with open('img/%s.jpg'%title,'wb') as openimg:
            openimg.write(imgget.content)

        print("正在下载:%s"%title)

 

#爬美女
import requests
import re

def guturl(num):
    # drrik()
    # 用get 请求访问一个网站
    r = requests.get('https://www.suibianlu.com/meitu_%s/'%num)
    # 编码 格式
    r.encoding = 'utf-8'
    # 以文本的格式输出
    a = r.text
    html = re.findall(r'<ul class="list-meizitu border pd5 mb10 clearfix">.*?</ul>', a, re.S)[0]
    urll = re.findall(r'<img src="(.*?)"', html, re.S)
    tilate = re.findall(r'alt="(.*?)"', html, re.S)
    i= 0
    for img in urll:
        aaa = tilate[i]
        i += 1

        imgres = requests.get(img)
        try:
            with open('img/%s.jfif'%aaa,'wb') as aff:
                aff.write(imgres.content)
        except:
            pass
        print("正在下载:%s"%aaa)
# def drrik():
#     for inn in range(15):
#         os.mkdir('img/美图文件%s'%inn)
def ru():
    for i in range(14):
        guturl(i)

if __name__ == '__main__':
    ru()

未经允许不得转载:作者:乔越, 转载或复制请以 超链接形式 并注明出处 乔越博客
原文地址:《python爬虫10分钟就能会的教程》 发布于2019-06-22

分享到:
赞(7) 打赏

评论 11

8 + 6 =
  1. #1

    文章不错非常喜欢

    今日新闻5个月前 (06-25)回复
  2. #2
    qq_avatar

    测试123

    小康博客4个月前 (07-13)回复
  3. #3

    with open('img/%s.jpg'%title,'wb') as openimg:
    FileNotFoundError: [Errno 2] No such file or directory: 'img/哦?.jpg'

    大佬怎么解决...

    超级萌新4个月前 (07-17)回复
    • qq_avatar

      可能时你没有img这个目录

      小康博客4个月前 (07-21)回复
    • 乔越

      你在代码的同级目录创建一个img文件夹就可以了

      管理员乔越4个月前 (07-21)回复
  4. #4

    为啥我下载的图片无法打开呢~

    Catchwinds3个月前 (08-13)回复
  5. #5
    qq_avatar

    up主可以加个好友一起学习吗

    人走草青2个月前 (09-10)回复
  6. #6

    这个是怎么回事呢请问
    C:\Users\zhan\AppData\Local\Programs\Python\Python36\python.exe C:/Users/zhan/Desktop/python/爬虫简易
    []

    Process finished with exit code 0

    浅步调1个月前 (10-05)回复
  7. #7

    啊">alert(1)

    sDDs2周前 (10-31)回复
  8. #8

    是">alert(1)" onload="alert(1)"

    sDDs2周前 (10-31)回复
python爬虫10分钟就能会的教程

长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

79代刷网
代刷网各种代刷 售后有保证 代做各种网站有需要留言给我即可!
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册