小说网站源码带采集建设

编辑整理:整理来源:百度知道,浏览量:57,时间:2022-08-17 10:21:01

小说网站源码带采集建设,小说源码 全自动采集,小说网站源码自动采集

喜欢看小说的朋友在线看小说时会被网站弹出的各种广告所干扰,体验非常差,这里分享自己写的一个爬小说的源码,方便大家把喜欢的小说下载后放到手机中直接观看无广告版

小说网站源码自动采集

废话不多说直接上源码:

import requests

import re

from pyquery import PyQuery as pq

#获取书章节地址

def book_url(url):

r = requests.get(url)

r.encoding = 'gb2312'

doc = pq(r.text)

test = pq(r.text)('#maininfo #info h1')

txtname = str(test.text())#获取书名

x = 0 #去除最新6章节

for item in doc(".listmain dl dd").items():

if x>5:

book_txt('https://www.abcxs.com' + item.find('a').attr('href'),txtname)

else:

x = x + 1

path = 'd:/test/' + str(txtname) + '.txt'

book_new(path)

#获取章节具体内容

def book_txt(url,txt_name):

r = requests.get(url)

doc = pq(r.text)

x = 0

path = 'd:/test/' + str(txt_name) + '.txt'

for item in doc("#book .content").items():

with op(path, 'a+',encoding="utf-8") as f:

f.write(item.find('.showtxt').text())

print("成功下载:" + item.find('h1').text())

#删除全本中广告内容

def book_new(path):

with op(str(path),'r+',encoding='utf-8') as file:

txt = re.compile(r'https://[a-zA-Z0-9.?/&=:]*',re.S)

new_txt = re.sub(txt,"",file.read())

file.write(new_txt)

if __name__=="__main__":

book_url("https://www.abcxs.com/book/97279/")#此处填写想要下载的小说目录页面

如果觉得麻烦的也可私信我直接要源码文件使用

行业热门话题:

【小说网站源码自动采集】【小说网站源码与教程】【小说网站资源采集地址】【小说网站采集接口】【小说小程序源码带采集】【小说网站源码带手机版】【小说源码 全自动采集】【自动采集小说源码】【小说网站源码下载】【开源小说网站源码】
小说网站源码带采集建设完!

相关推荐:


关键词文章生成器,点击查看演示目录:http://www.wskqs.cn/shisange/


信宜池洞镇如何写好软文做好网络营销| 打造一套营销软文-打造一套营销软文需要多久| 帝国cms首页调用栏目| 短故事式软文营销案例 故事软文营销案例200字| 税筹家政软文推广 税筹家政软文推广| 软文营销 广安朝阳软文营销范文| wordpress 壁纸图片插件 wordpress 照片墙| 主持人接单视频拍摄| 视频工作室接单 华士镇视频工作室怎么接单| 百日维新-百日维新的主要内容|
投稿| 1024(定向养站+文章采集+ai聚合)目录程序| 1888(定向养站+文章采集+ai聚合)泛目录版| 双标题| 挖关键词| 违禁词删除| 伪原创| 免费配图| 自助解答| 站长变现| 今日头条| 问答聚合| 818(今日头条资讯聚合演示)| 1024(采集聚合+ai聚合)| 1024 (AI定向养站目录程序)| 淘客文章带货| 定向养站目录程序| ai写作目录程序

苏ICP备2021004623号 (免责声明:本网站部分内容由用户自行上传,如权利人发现存在侵犯其权益情形,请及时与本站联系。)(版权所有:昆山市一路火信息技术服务中心) 友情导航 网络警察提醒您 中国互联网辟谣平台 中国文明网传播文明 中国互联网举报中心