小说网站源码带采集建设

编辑整理：整理来源：百度知道，浏览量：98，时间：2022-08-17 10:21:01

小说网站源码带采集建设，小说源码全自动采集，小说网站源码自动采集

喜欢看小说的朋友在线看小说时会被网站弹出的各种广告所干扰，体验非常差，这里分享自己写的一个爬小说的源码，方便大家把喜欢的小说下载后放到手机中直接观看无广告版

废话不多说直接上源码：

import requests

import re

from pyquery import PyQuery as pq

#获取书章节地址

def book_url(url):

r = requests.get(url)

r.encoding = 'gb2312'

doc = pq(r.text)

test = pq(r.text)('#maininfo #info h1')

txtname = str(test.text())#获取书名

x = 0 #去除最新6章节

for item in doc(".listmain dl dd").items():

if x>5:

book_txt('https://www.abcxs.com' + item.find('a').attr('href'),txtname)

else:

x = x + 1

path = 'd:/test/' + str(txtname) + '.txt'

book_new(path)

#获取章节具体内容

def book_txt(url,txt_name):

r = requests.get(url)

doc = pq(r.text)

x = 0

path = 'd:/test/' + str(txt_name) + '.txt'

for item in doc("#book .content").items():

with op(path, 'a+',encoding="utf-8") as f:

f.write(item.find('.showtxt').text())

print("成功下载：" + item.find('h1').text())

#删除全本中广告内容

def book_new(path):

with op(str(path),'r+',encoding='utf-8') as file:

txt = re.compile(r'https://[a-zA-Z0-9.?/&=:]*',re.S)

new_txt = re.sub(txt,"",file.read())

file.write(new_txt)

if __name__=="__main__":

book_url("https://www.abcxs.com/book/97279/")#此处填写想要下载的小说目录页面

如果觉得麻烦的也可私信我直接要源码文件使用

行业热门话题：

【小说网站源码自动采集】【小说网站源码与教程】【小说网站资源采集地址】【小说网站采集接口】【小说小程序源码带采集】【小说网站源码带手机版】【小说源码全自动采集】【自动采集小说源码】【小说网站源码下载】【开源小说网站源码】

小说网站源码带采集建设完！

小说网站源码带采集建设

行业热门话题：

相关推荐：

小说网站源码带采集建设

关键词文章生成器，点击查看演示目录：http://www.wskqs.cn/shisange/

营销软文怎么样才能发到微博里-营销软文怎么样才能发到微博里面

杭州直播代运营排名-杭州直播代运营机构

中小企业互联网获客-互联网中小型企业

云优超级蜘蛛池使用过的说下心得-云蜘蛛科技有限公司

南宁网站制作方案定制-南宁网站制作哪家好

镇江电商平台代运营公司排名-镇江电商平台代运营公司排名榜

南京seo-南京SEO培训

教育培训机构营销软文-教育培训机构营销软文怎么写

软文营销大枣的方法-软文营销大枣的方法有哪些

搜狗竞价代运营企业-搜狗竞价代运营企业怎么样

椰子冻-椰子冻的做法

小吃文化-沙县小吃文化

羽绒服营销软文-羽绒服营销软文300字

课程推广软文百度文库-课程推广软文百度文库怎么做

风水软文营销-风水软文营销策略

独立站是什么物流-独立站是什么物流类型

宜宾有做蜘蛛池模板程序不错-宜宾有做蜘蛛池模板程序不错的厂家吗

蜘蛛池对外推还有用-蜘蛛池使用教程

硬壳-硬壳冲锋衣和软壳冲锋衣区别

元宵节的风俗习惯-元宵节日的风俗