Python爬虫 + AI 极简实战

1:爬虫爬网页内容 + AI自动总结

场景:爬文章/新闻/文案,AI一键精简、提炼观点、写摘要

python

import requests

from bs4 import BeautifulSoup

from openai import OpenAI

1. 简单爬虫获取网页正文

url = "https://www.example.com/article.html" # 替换目标网址

headers = {"User-Agent": "Mozilla/5.0"}

res = requests.get(url, headers=headers)

soup = BeautifulSoup(res.text, "html.parser")

提取正文(根据网页改标签)

content = soup.get_text(strip=True):2000 # 限制长度防超限

2. 调用AI总结(可用GPT/豆包/通义千问任意大模型)

client = OpenAI(

api_key="你的API密钥",

base_url="https://api.doubao.com/v1" # 豆包/中转接口,免费好用

)

prompt = f"""

请精简总结下面这段内容,通俗易懂:

{content}

"""

response = client.chat.completions.create(

model="doubao-pro",

messages={"role":"user", "content":prompt}

)

输出结果

print("AI总结:")

print(response.choices0.message.content)

用法2:爬虫采集榜单/文案 + AI改写伪原创

适合情感博主、自媒体:爬热门文案,AI改写洗稿、换风格、治愈/清醒文案二创

python

import requests

from bs4 import BeautifulSoup

from openai import OpenAI

爬取热门短句/情感文案

url = "文案网站地址"

html = requests.get(url).text

soup = BeautifulSoup(html, "html.parser")

text_list = p.get_text() for p in soup.find_all("p")

AI批量改写

client = OpenAI(api_key="你的密钥", base_url="对应接口")

for text in text_list:5:

if len(text) > 5:

res = client.chat.completions.create(

model="doubao-pro",

messages={"role":"user", "content":f"改成高级治愈风情感文案:{text}"}

)

print("原文案:", text)

print("AI改写:", res.choices0.message.content)

print("-"*50)

用法3:爬虫抓数据 + AI分类/情绪分析

结合你做情感博主刚需:

爬评论、私信、网友情绪文案,AI自动判断:焦虑/委屈/恋爱脑/回避型情绪

python

from openai import OpenAI

假设爬虫爬到的用户留言

comment_list = [

"他总是忽冷忽热,我每天内耗睡不着",

"我习惯性讨好别人,害怕被抛弃",

"不想谈恋爱,只想一个人独处"

]

client = OpenAI(api_key="你的密钥", base_url="接口地址")

for msg in comment_list:

prompt = f"判断这段文字的情绪和依恋类型:{msg}"

ans = client.chat.completions.create(

model="doubao-pro",

messages={"role":"user", "content":prompt}

)

print(msg, "→", ans.choices0.message.content)

相关推荐
IT_陈寒22 分钟前
Redis内存爆了,原来我漏掉了这个致命配置
前端·人工智能·后端
luckdewei2 小时前
FastAPI 资产管理系统实战:复杂 ORM 关联、Alembic 迁移与 N+1 查询优化
python
用户3521802454752 小时前
🎆从 Prompt 到 Skill:让 Spring AI Agent 学会"装新技能"
人工智能·spring boot·ai编程
米小虾3 小时前
手把手教你搭建第一个生产级AI Agent:从选型到实战的完整指南
人工智能·agent
任沫3 小时前
Agent之Function Call
javascript·人工智能·go
米小虾3 小时前
2026年AI Agent全面爆发:从开源生态到企业级应用的进化之路
人工智能·agent
用户6919026813393 小时前
Vibe Coding 开发项目的基本范式
人工智能·设计模式·代码规范
To_OC3 小时前
别再跟 AI 死磕 prompt 了,我写了个 Loop 让它自己改到满意为止
人工智能·aigc·agent
血小溅4 小时前
三大 AI 编码框架深度对比:GSD vs OpenSpec vs Superpowers
人工智能·后端
武子康7 小时前
调查研究-186 LangChain 和 LangGraph 的区别:从快速构建 Agent 到生产级工作流编排
人工智能·langchain·llm