Python爬虫 + AI 极简实战

1:爬虫爬网页内容 + AI自动总结

场景:爬文章/新闻/文案,AI一键精简、提炼观点、写摘要

python

import requests

from bs4 import BeautifulSoup

from openai import OpenAI

1. 简单爬虫获取网页正文

url = "https://www.example.com/article.html" # 替换目标网址

headers = {"User-Agent": "Mozilla/5.0"}

res = requests.get(url, headers=headers)

soup = BeautifulSoup(res.text, "html.parser")

提取正文(根据网页改标签)

content = soup.get_text(strip=True)[:2000] # 限制长度防超限

2. 调用AI总结(可用GPT/豆包/通义千问任意大模型)

client = OpenAI(

api_key="你的API密钥",

base_url="https://api.doubao.com/v1" # 豆包/中转接口,免费好用

)

prompt = f"""

请精简总结下面这段内容,通俗易懂:

{content}

"""

response = client.chat.completions.create(

model="doubao-pro",

messages=[{"role":"user", "content":prompt}]

)

输出结果

print("AI总结:")

print(response.choices[0].message.content)

用法2:爬虫采集榜单/文案 + AI改写伪原创

适合情感博主、自媒体:爬热门文案,AI改写洗稿、换风格、治愈/清醒文案二创

python

import requests

from bs4 import BeautifulSoup

from openai import OpenAI

爬取热门短句/情感文案

url = "文案网站地址"

html = requests.get(url).text

soup = BeautifulSoup(html, "html.parser")

text_list = [p.get_text() for p in soup.find_all("p")]

AI批量改写

client = OpenAI(api_key="你的密钥", base_url="对应接口")

for text in text_list[:5]:

if len(text) > 5:

res = client.chat.completions.create(

model="doubao-pro",

messages=[{"role":"user", "content":f"改成高级治愈风情感文案:{text}"}]

)

print("原文案:", text)

print("AI改写:", res.choices[0].message.content)

print("-"*50)

用法3:爬虫抓数据 + AI分类/情绪分析

结合你做情感博主刚需:

爬评论、私信、网友情绪文案,AI自动判断:焦虑/委屈/恋爱脑/回避型情绪

python

from openai import OpenAI

假设爬虫爬到的用户留言

comment_list = [

"他总是忽冷忽热,我每天内耗睡不着",

"我习惯性讨好别人,害怕被抛弃",

"不想谈恋爱,只想一个人独处"

]

client = OpenAI(api_key="你的密钥", base_url="接口地址")

for msg in comment_list:

prompt = f"判断这段文字的情绪和依恋类型:{msg}"

ans = client.chat.completions.create(

model="doubao-pro",

messages=[{"role":"user", "content":prompt}]

)

print(msg, "→", ans.choices[0].message.content)

相关推荐
QQ24221997923 分钟前
基于python+微信小程序的家教管理系统_mh3j9
开发语言·python·微信小程序
Neolnfra24 分钟前
拒绝数据“裸奔”!把顶级AI装进自己的硬盘,这款神仙开源工具我粉了
人工智能·开源·蓝耘maas
code_li25 分钟前
只花了几分钟,用AI开发了一个微信小程序!(附教程)
人工智能·微信小程序·小程序
飞Link40 分钟前
瑞萨联姻 Irida Labs:嵌入式开发者如何玩转“端侧视觉 AI”新范式?
人工智能
RSTJ_16251 小时前
PYTHON+AI LLM DAY THREETY-SEVEN
开发语言·人工智能·python
郝学胜-神的一滴1 小时前
深度学习优化核心:梯度下降与网络训练全解析
数据结构·人工智能·python·深度学习·算法·机器学习
Aision_1 小时前
Agent 为什么需要 Checkpoint?
人工智能·python·gpt·langchain·prompt·aigc·agi
清水白石0081 小时前
《Python性能深潜:从对象分配开销到“小对象风暴”的破解之道(含实战与最佳实践)》
开发语言·python
小贺儿开发1 小时前
《唐朝诡事录之长安》——盛世马球
人工智能·unity·ai·shader·绘画·影视·互动
秋91 小时前
ESP32 与 Air780E 4G 模块配合做 MQTT 数据传输
人工智能