今天凯某人被同学要求去下载一本笔趣阁的小说 本人边学边做 实现了读取并保存为txt文件。

首先废话不多说上代码

import re
import time
import requests
from bs4 import BeautifulSoup
urly="https://www.bqg5.cc/89_89739/" //图书地址
for id in range(155399464,156626079):   //阅读中起始章节id和最后一章的id
    time.sleep(3)   //延迟 防止banip
    url=urly+str(id)+".html"
    response=requests.get(url)
    soup = BeautifulSoup(response.text,"html.parser")
    biaoti=soup.title.string
    zhengwen=soup.find_all("p")
    ok=str(biaoti)+"\n"+str(zhengwen)
    path = "D:\\pachong\\"
    full_path=path+biaoti+".txt"
    file=open(full_path,"w")
    file.write(ok)
    print(ok)

QQ图片20200311221906.png
}_}$_L~CQ5EDPQMLANMK@$Q.png
不要吐槽我中文变量名哈哈哈哈 还有很低效的做法 毕竟第一次用python的爬虫

  • 首先使用的是 beautifulsoup的解决方案

    比较头疼的是在笔趣阁网站内没有找到CLASS,所以度娘 最后用到了 soup的find_all 查找了所有的“p”(因为只有正文有p)这样就保存下来了。然后在用批量替换吧“p”等删掉
    好了 读代码摸索即可!