python自动爬取,保存并运行程序。

本文使用创作助手。

第一步(可跳过,熟悉一下而已):

要在Python中新建一个文本文档并写入内容,可以使用文件操作功能。以下是一个示例代码:

python 复制代码
# 新建文本文档并写入内容
with open('output.txt', 'w', encoding='utf-8') as file:
    file.write("Hello, World!\n")
    file.write("This is a new text file created using Python.")

在上述代码中,output.txt是要创建的文本文档的名称和路径。'w'表示以写入模式打开文件。

with语句中,file.write()用于写入内容。您可以通过多次调用file.write()来写入多行内容。

运行上述代码后,将会创建一个名为output.txt的文本文档,并写入指定的内容。

请注意,在使用with语句后,文件将自动关闭。这是一种推荐的文件操作方式,可以确保文件在使用完后正常关闭,而无需手动调用file.close()

第二步(开始啦):

要从CSDN上爬虫下载文章,可以使用Python的requests和BeautifulSoup库来实现。

首先,需要安装requests和BeautifulSoup库,可以使用以下命令来安装:

复制代码
pip install requests
pip install beautifulsoup4

接下来,可以使用以下代码来爬取CSDN上的文章并保存到本地文件中:

python 复制代码
import requests
from bs4 import BeautifulSoup

# 目标文章的URL
url = 'https://blog.csdn.net/xxx/article/details/xxx'

# 发起GET请求获取页面内容
response = requests.get(url)

# 使用BeautifulSoup解析页面内容
soup = BeautifulSoup(response.text, 'html.parser')

# 获取文章标题
title = soup.find('h1', class_='title-article').text

# 获取文章内容
content = soup.find('div', class_='blog-content-box').text

# 打开文件并保存文章内容
with open('input.txt', 'w', encoding='utf-8') as f:#这里的input.txt可以换成别的名字
    f.write(content)

在上述代码中,需要将url替换为您要爬取的CSDN文章的URL。然后,使用requests.get()方法获取页面内容,再使用BeautifulSoup解析页面内容。

接下来,使用soup.find()方法找到文章标题和内容的HTML元素,然后获取其文本内容。最后,使用文件操作将文章内容保存为一个文本文件。

请注意,根据CSDN的限制,爬虫行为可能会触发反爬虫机制,所以请确保您的爬虫行为不会对CSDN的服务器造成过大的压力,并遵守网站的使用规定。

第三步:

要将一个文本文件保存为Python文件并打开,您可以使用Python的文件操作功能和os模块。

首先,您需要读取文本文件的内容,可以使用以下代码:

python 复制代码
# 读取文本文件内容
with open('input.txt', 'r', encoding='utf-8') as file:
    content = file.read()

在上述代码中,将input.txt替换为您要读取的文本文件的路径。

接下来,您需要将文本内容保存为Python文件,可以使用以下代码:

python 复制代码
# 将文本内容保存为Python文件
with open('output.py', 'w', encoding='utf-8') as file:
    file.write(content)

在上述代码中,将output.py替换为您要保存的Python文件的路径和名称。

最后,您可以使用os模块中的system函数执行python命令来打开保存的Python文件,可以使用以下代码:

python 复制代码
import os

# 打开保存的Python文件
os.system('python output.py')

运行上述代码后,将会自动保存文本文件为Python文件,并打开保存的Python文件。

请注意,为了确保代码的安全性,请确保您只打开您信任的文件,以防止恶意代码的执行。

相关推荐
relis12 分钟前
llama.cpp Flash Attention 论文与实现深度对比分析
人工智能·深度学习
盼小辉丶16 分钟前
Transformer实战(21)——文本表示(Text Representation)
人工智能·深度学习·自然语言处理·transformer
Madison-No719 分钟前
【C++】探秘string的底层实现
开发语言·c++
艾醒(AiXing-w)20 分钟前
大模型面试题剖析:模型微调中冷启动与热启动的概念、阶段与实例解析
人工智能·深度学习·算法·语言模型·自然语言处理
科技小E24 分钟前
流媒体视频技术在明厨亮灶场景中的深度应用
人工智能
geneculture33 分钟前
融智学院十大学部知识架构示范样板
人工智能·数据挖掘·信息科学·哲学与科学统一性·信息融智学
无风听海34 分钟前
神经网络之交叉熵与 Softmax 的梯度计算
人工智能·深度学习·神经网络
算家计算35 分钟前
AI树洞现象:是社交降级,还是我们都在失去温度?
人工智能
java1234_小锋37 分钟前
TensorFlow2 Python深度学习 - TensorFlow2框架入门 - 神经网络基础原理
python·深度学习·tensorflow·tensorflow2
JJJJ_iii39 分钟前
【深度学习03】神经网络基本骨架、卷积、池化、非线性激活、线性层、搭建网络
网络·人工智能·pytorch·笔记·python·深度学习·神经网络