每日一题23:统计文本中单词出现的次数

一、每日一题

解答:

python 复制代码
import pandas as pd
def count_occurrences(files: pd.DataFrame) -> pd.DataFrame:
    bull_cnt = len(files[files['content'].str.contains(r'\sbull\s')])
    bear_cnt = len(files[files['content'].str.contains(r'\sbear\s')])
    res_df = pd.DataFrame(
        {
            'word': ['bull', 'bear'],
            'count': [bull_cnt, bear_cnt]
        }
    )
    return res_df

题源:Leetcode

二、 总结

files['content'].str.contains(r'\sbull\s'):

  • 使用 str.contains() 方法来查找 content 列中包含匹配正则表达式 r'\sbull\s' 的行。
  • 正则表达式**r'\sbull\s'** 寻找以空白字符(空格)开头和结尾的 "bull" 字符串:
    • \s 表示空白字符(比如空格、制表符等)。
    • 因此,r'\sbull\s' 匹配的是整个单词 "bull",而不会匹配诸如 "bulldog" 或 "bullish" 这样的部分匹配。

2024.5.26

相关推荐
Seven978 分钟前
【Guava】并发编程ListenableFuture&Service
java
WannaRunning8 分钟前
浅谈Tomcat数据源连接池
java·oracle·tomcat
信徒_9 分钟前
Mysql 在什么样的情况下会产生死锁?
android·数据库·mysql
forestsea16 分钟前
使用 Spring Boot 和 GraalVM 的原生镜像
java·spring boot·spring native·原生映像
逸狼18 分钟前
【JavaEE进阶】Spring AOP入门
java·java-ee
色空大师22 分钟前
【idea】实用插件
java·ide·intellij-idea
栗筝i29 分钟前
Spring 核心技术解析【纯干货版】- XIX:Spring 日志模块 Spring-Jcl 模块精讲
java·后端·spring
时光追逐者31 分钟前
在 Blazor 中使用 Chart.js 快速创建数据可视化图表
开发语言·javascript·信息可视化·c#·.net·blazor
小天努力学java36 分钟前
【面试题】如何用两个线程轮流输出0-200的值
java·开发语言
嘴对嘴编程1 小时前
oracle数据泵操作
数据库·oracle