python基础知识点(蓝桥杯python科目个人复习计划70)

继续打基础,爬虫部分随笔

第一题:特别数的和

题目描述:

小明对数位中含有2、0、1、9的数(不包含前导0)很感兴趣,在1到40中这样的数共有28个,它们的和是574。

请问在1到n中,这样的数的和是多少?

输入格式:

共一行,包含一个整数n

输出格式:

共一行,包含一个整数,表示符合条件的数的和。

python 复制代码
def check(n):
    while n > 0:
        tmpn = n % 10
        if tmpn == 2 or tmpn == 0 or tmpn == 1 or tmpn == 9:
            return True
        n //= 10
    return False
n = int(input())
ans = 0
for i in range(1,n + 1):
    if check(i):
        ans += i
print(ans)

今天只写一个题,灵感爆发,我想再续写一下爬虫的相关内容。

上次不是说到把得到的数据保存到数据库MySQL中嘛,这次我来写一下怎样将其可视化。

我自己的做法是将得到的数据保存为json格式,然后我要画出柱状图和词云图。以下是实现的代码。

python 复制代码
import json
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
from wordcloud import WordCloud
import jieba

with open('./maoer1.json', 'r', encoding='utf-8') as file:
    movies = [json.loads(line) for line in file]
df = pd.DataFrame(movies)

font_path = './NotoSerifSC-Black.ttf'
font_prop = FontProperties(fname=font_path)

plt.rcParams['font.family'] = font_prop.get_name()


plt.figure(figsize=(10, 6))
plt.barh(df['movie_name'], df['score'].astype(float), color='skyblue')
plt.xlabel('评分',fontproperties=font_prop)
plt.ylabel('电影名称',fontproperties=font_prop)
plt.title('电影评分柱状图',fontproperties=font_prop)

plt.yticks(fontproperties=font_prop)
plt.gca().invert_yaxis()
plt.show()


text = ' '.join(df['description'])
wordlist = jieba.cut(text, cut_all=False)
wl_space_split = " ".join(wordlist)

wordcloud = WordCloud(
    font_path=font_path,
    width=800,
    height=400,
    background_color='white'
).generate(wl_space_split)

plt.figure(figsize=(10, 6))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.title('电影描述词云',fontproperties=font_prop)
plt.show()

但是,我不知道为啥,每次我运行这个代码,首先出来的是柱状图,将其关闭后还要过一会儿才会出现词云图,我一直不理解。


那这篇就这样了,我会在下一篇详细地写出scrapy爬取豆瓣的流程,感兴趣的朋友可以看一看,顺便指出我的错误。

相关推荐
元亓亓亓7 小时前
LeetCode热题100--416. 分割等和子集--中等
算法·leetcode·职场和发展
顽强卖力12 小时前
第二章:什么是数据分析师?
笔记·python·职场和发展·学习方法
hqyjzsb13 小时前
从爱好到专业:AI初学者如何跨越CAIE认证的理想与现实鸿沟
大数据·c语言·人工智能·信息可视化·职场和发展·excel·业界资讯
历程里程碑14 小时前
滑动窗口解法:无重复字符最长子串
数据结构·c++·算法·leetcode·职场和发展·eclipse·哈希算法
youngee1115 小时前
hot100-55有效的括号
算法·leetcode·职场和发展
我命由我1234516 小时前
Photoshop - Photoshop 工具栏(46)渐变工具
经验分享·笔记·学习·ui·职场和发展·学习方法·photoshop
我命由我1234520 小时前
Photoshop - Photoshop 工具栏(45)历史记录艺术画笔工具
学习·ui·职场和发展·求职招聘·职场发展·学习方法·photoshop
妮妮喔妮20 小时前
前端字节面试大纲
前端·面试·职场和发展
Swift社区21 小时前
LeetCode 459 - 重复的子字符串
算法·leetcode·职场和发展
ocean210321 小时前
Linux面试题图解
linux·运维·服务器·面试·职场和发展