Python爬虫下载新闻,Flask展现新闻(2)

上篇讲了用Python从新闻网站上下载新闻,本篇讲用Flask展现新闻。关于Flask安装网上好多教程,不赘述。下面主要讲 HTML-Flask-数据 的关系。

简洁版

如图,页面简单,主要显示新闻标题。

分页,使用最简单的分页技术,不用ajax,在链接中增加页码参数 /txw/1 ,由flask根据参数返回新闻。

flask路由代码:

python 复制代码
#今日头条
@app.route('/txw')
@app.route('/txw/<page>')

def today_news(page=1):

    ua = request.headers.get('User-Agent')
    mb = from_mobile(ua)

    #移动端和PC端
    file = "day_news_m.html" if mb else "day_news.html"

    news = daily_news(page)
    return render_template(file,news = news)

每天下载的新闻用文件保存。注,每条新闻设置一个id,分页就是根据id返回。比如现在最新id是10000,每页显示100页, 链接/txw/1 表示 返回id 小于10000大于9900的新闻。

复杂版,按不同频道聚合新闻,包括标题、摘要、热点、收藏等功能,其它比如HTML+CSS设置导航栏后面再讲。

新闻频道划分如下

最新:最新下载的新闻;

关注:根据设置的新闻关键词聚合新闻,这是根据自己的设定来筛选新闻,不是推荐;

要闻:宏观、政策类新闻;

时事:国际政治、军事、局势新闻;

快讯:跟股市相关的突发新闻;

财经:财经类新闻;

科技:半导体、TMT、人工智能等科技类新闻;

英文:国外科技类新闻;

社会:社会、娱乐类新闻,满足偶尔看八卦的需求。

每条新闻下载时根据标题关键词确认频道。比如标题包含以下词语的就是科技:

['通信','5G','6G','AI','人工智能','算力','GPT','openAI','云计算','短剧','元宇宙','游戏','影视','电影','AR','VR','TMT','动漫','漫画', '5.5G','头戴式','微软','Google','苹果','生成式','机器人','公有云','大模型','大数据','英伟达','脑机']

HMTL页面-导航栏

html 复制代码
        <thead>
        <td><a href="#top">最新</a></td>
        <td><a href="#关注">关注</a></td>
        <td><a href="#要闻">要闻</a></td>
        <td><a href="#快讯">快讯</a></td>
        <td><a href="#时事">时事</a></td>
        <td><a href="#经济">财经</a></td>
        <td><a href="#TMT">科技</a></td>
        <td><a href="#消费">消费</a></td>
        <td><a href="#Tech">英文</a></td>
        <td><a href="#社会">社会</a></td>
        </thead>

新闻HTML页面主要结构:

html 复制代码
    {% for i in news %}
        <tr><!-- 频道  体验见 http://101.35.10.13/xw -->
            <th id ={{i[0][-2]}} style="text-align: left;border: 0;background-color: #FFFFF0">{{i[0][-2]}}</th>
            <th style="text-align: left;border: 0;background-color: #FFFFF0"><a href="#top" >{{i[0][-1]}}</a></th>
            <th colspan ="12" style="border: 0;background-color: #FFFFF0"></th>
        </tr>

        {% for j in i %}
        <tr><th colspan ="14" style="font-size: 16px;text-align: left;padding: 5px">
            <!-- 标题和链接  -->
            <a href="javascript:;" onclick="show_full_news('{{j[2]}}')"> {{j[0]}}</a>
        </th></tr>
        <tr>
            <!-- 摘要 -->
            <td colspan ="14" style="font-size: 14px;text-align: left;padding: 5px">{{j[1]}}&nbsp{{j[3]}}</td>
        </tr>
        {% endfor %}

    {% endfor %}

Flask代码:

python 复制代码
#新闻
@app.route('/xw')
def news():

    ua = request.headers.get('User-Agent')
    mb = from_mobile(ua)

    try:acct = session['acct']
    except:acct = ''
    
    file = 'news_mb.html' if mb else 'news.html'

    #返回新闻,acct用于加载关注新闻关键词,若空,则无关注新闻
    news = chs_news(acct,60,mb)

    return render_template(file,news = news)

这就是下载新闻、展现新闻的主要思路和技术。当然还有很多细节,如果大家有兴趣,后面详细说。若有疑问,尽管留言。

相关推荐
MinggeQingchun17 分钟前
Python - 初识Python;Python解释器下载安装;Python IDE(一)
python·pycharm
大数据编程之光22 分钟前
Python版Spark Structured Streaming编程指南
开发语言·python·spark
豌豆花下猫23 分钟前
Python 潮流周刊#77:Python 依赖管理就像垃圾场火灾?(摘要)
后端·python·ai
红队it23 分钟前
【计算机毕设】无查重 基于python豆瓣电影评论舆情数据可视化系统(完整系统源码+数据库+开发笔记+详细部署教程)✅
数据库·笔记·python·算法·机器学习·信息可视化·数据分析
理想不理想v36 分钟前
vue2和vue3:diff算法的区别?
前端·javascript·vue.js·python·tornado
工业互联网专业1 小时前
Python毕业设计选题:基于django+vue的二手物品交易系统
vue.js·python·django·毕业设计·源码·课程设计
柯大侠爱喝水1 小时前
python pandas ,处理csv文件、hdf5文件、parquet文件效率详细对比
python·pandas·csv·hdf5·parquet
一夜白头催人泪1 小时前
Django的RBAC认证和权限
后端·python·django
Tech Synapse1 小时前
Python如何获取request response body
python·requests·response body
licy__1 小时前
python的matplotlib实现数据分析绘图
开发语言·python