手写一个摸鱼神器:使用python手写一个看小说的脚本,在ide中输出小说内容,同事直呼“还得是你”

文章目录

一、准备python环境

windows从0搭建python3开发环境与开发工具

Python爬虫基础(一):urllib库的使用详解
Python爬虫基础(二):使用xpath与jsonpath解析爬取的数据

二、分析小说网的章节目录

最近迷上了《史上最全炼气期》,我们以这一部小说为例:

小说章节列表:http://www.yetianlian.cc/yt4017/

我们可以爬取关键信息:章节名和章节的url,遍历章节名,通过章节的url即可获取每一章的内容!

三、分析小说网的章节内容

每一章的内容,也可以很轻松的得到。

接下来就是编码了。

四、编写python脚本

py 复制代码
import urllib.request
from lxml import etree


def create_request(url):
    '''
        构造请求request
    '''
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36',
    }
    request = urllib.request.Request(url = url, headers = headers)
    return request

def get_content(request):
    '''
        得到响应内容
    '''
    response = urllib.request.urlopen(request)
    content = response.read().decode('utf-8')
    return content


if __name__ == '__main__':
    # 获取所有章节
    base_url = 'http://www.yetianlian.cc/yt4017/'
    request = create_request(base_url) 
    content = get_content(request)
    base_tree = etree.HTML(content)
    # 章节名
    name_list = base_tree.xpath('//div[@class="listmain"]/dl/dd/a/text()')
    # 章节地址
    url_list = base_tree.xpath('//div[@class="listmain"]/dl/dd/a/@href')

    # 定位到从哪一章开始读
    key = input('请输入要阅读的章节:')
    begin = 0
    for i in range(0, len(name_list)-1):
        if(key in name_list[i]):
            begin = i


    for i in range(begin, len(name_list)-1):
        input('章节名---------------------->' + name_list[i])
        # 获取具体哪一章的内容
        url = 'http://www.yetianlian.cc' + url_list[i]
        request = create_request(url) 
        content = get_content(request)
        tree = etree.HTML(content)
        # 获取小说的内容
        result = tree.xpath('//div[@id="content"]/text()')
        # 遍历内容
        for res in result:
            input(res)
    print('-------------->end')

五、验证一下吧

我们随便使用一个ide,在下面打开命令行,执行命令,执行脚本:

bash 复制代码
python story.py

然后输入要阅读的章节,不断的按回车键,就可以一直刷出内容了!是不是摸鱼神器~

相关推荐
再见晴天*_*25 分钟前
SpringBoot 中单独一个类中运行main方法报错:找不到或无法加载主类
java·开发语言·intellij idea
lqjun08272 小时前
Qt程序单独运行报错问题
开发语言·qt
酷飞飞3 小时前
Python网络与多任务编程:TCP/UDP实战指南
网络·python·tcp/ip
hdsoft_huge4 小时前
Java & Spring Boot常见异常全解析:原因、危害、处理与防范
java·开发语言·spring boot
风中的微尘4 小时前
39.网络流入门
开发语言·网络·c++·算法
数字化顾问4 小时前
Python:OpenCV 教程——从传统视觉到深度学习:YOLOv8 与 OpenCV DNN 模块协同实现工业缺陷检测
python
未来之窗软件服务5 小时前
幽冥大陆(二)RDIFSDK 接口文档:布草洗涤厂高效运营的技术桥梁C#—东方仙盟
开发语言·c#·rdif·仙盟创梦ide·东方仙盟
小冯记录编程5 小时前
C++指针陷阱:高效背后的致命危险
开发语言·c++·visual studio
学生信的大叔5 小时前
【Python自动化】Ubuntu24.04配置Selenium并测试
python·selenium·自动化
1uther5 小时前
Unity核心概念⑨:Screen
开发语言·游戏·unity·c#·游戏引擎