欢迎光临
我们一直在努力

杰奇多线程自动采集同步源站 python源码

杰奇多线程自动采集同步源站 python源码

该工具为python代码,对目标源站进行循环采集,同步更新。
采用多线程采集,保证采集速度。采集线程数可根据自己服务器压力自由调整。
采用小说字数比对,仅当当前字数大于已采集字数时才认为该小说有章节更新而进行采集,从而减少不必要的资源浪费。
测试目标站为17K小说网,自己使用的时候请配合自己网站后台规则修改siteid。同时根据目标列表页的代码,修改正则规则。
该正则规则获取3个参数 [0]为书号 [1]为书名 [2]为采集时候的字数。

使用本工具后,无需使用关关等采集器,可以做到单Linux服务器运行小说站。

 

 

 收藏 (0) 打赏

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

未经允许不得转载:免费空间 » 杰奇多线程自动采集同步源站 python源码

分享到: 生成海报
avatar

热门文章

  • 评论 抢沙发

    评论前必须登录!

    立即登录  

    铭宇网络建站 专业 快捷

    联系我们联系我们

    登录

    忘记密码 ?