每日一题23:统计文本中单词出现的次数

一、每日一题

解答:

python 复制代码
import pandas as pd
def count_occurrences(files: pd.DataFrame) -> pd.DataFrame:
    bull_cnt = len(files[files['content'].str.contains(r'\sbull\s')])
    bear_cnt = len(files[files['content'].str.contains(r'\sbear\s')])
    res_df = pd.DataFrame(
        {
            'word': ['bull', 'bear'],
            'count': [bull_cnt, bear_cnt]
        }
    )
    return res_df

题源:Leetcode

二、 总结

files['content'].str.contains(r'\sbull\s'):

  • 使用 str.contains() 方法来查找 content 列中包含匹配正则表达式 r'\sbull\s' 的行。
  • 正则表达式**r'\sbull\s'** 寻找以空白字符(空格)开头和结尾的 "bull" 字符串:
    • \s 表示空白字符(比如空格、制表符等)。
    • 因此,r'\sbull\s' 匹配的是整个单词 "bull",而不会匹配诸如 "bulldog" 或 "bullish" 这样的部分匹配。

2024.5.26

相关推荐
kk哥88993 分钟前
分享一些学习JavaSE的经验和技巧
java·开发语言
栈与堆20 分钟前
LeetCode 21 - 合并两个有序链表
java·数据结构·python·算法·leetcode·链表·rust
lagrahhn29 分钟前
Java的RoundingMode舍入模式
java·开发语言·金融
鸽鸽程序猿34 分钟前
【JavaEE】【SpringCloud】注册中心_nacos
java·spring cloud·java-ee
coding-fun35 分钟前
电子发票批量提取导出合并助手
大数据·数据库
leo_23236 分钟前
备份&恢复--SMP(软件制作平台)语言基础知识之三十九
数据库·数据安全·开发工具·smp(软件制作平台)·应用系统
何以不说话39 分钟前
mysql 的主从复制
运维·数据库·学习·mysql
二二牧人40 分钟前
qemu arm64 linux开发环境搭建
linux·运维·数据库
云上凯歌42 分钟前
01 GB28181协议基础理解
java·开发语言
茁壮成长的露露43 分钟前
导出导入工具mongoexport、mongoimport
数据库·mongodb