每日一题23:统计文本中单词出现的次数

一、每日一题

解答:

python 复制代码
import pandas as pd
def count_occurrences(files: pd.DataFrame) -> pd.DataFrame:
    bull_cnt = len(files[files['content'].str.contains(r'\sbull\s')])
    bear_cnt = len(files[files['content'].str.contains(r'\sbear\s')])
    res_df = pd.DataFrame(
        {
            'word': ['bull', 'bear'],
            'count': [bull_cnt, bear_cnt]
        }
    )
    return res_df

题源:Leetcode

二、 总结

files['content'].str.contains(r'\sbull\s'):

  • 使用 str.contains() 方法来查找 content 列中包含匹配正则表达式 r'\sbull\s' 的行。
  • 正则表达式**r'\sbull\s'** 寻找以空白字符(空格)开头和结尾的 "bull" 字符串:
    • \s 表示空白字符(比如空格、制表符等)。
    • 因此,r'\sbull\s' 匹配的是整个单词 "bull",而不会匹配诸如 "bulldog" 或 "bullish" 这样的部分匹配。

2024.5.26

相关推荐
用坏多个鼠标5 分钟前
Nacos和Nginx集群,项目启动失败问题
java·开发语言
歪歪10020 分钟前
在C#中除了按属性排序,集合可视化器还有哪些辅助筛选的方法?
开发语言·前端·ide·c#·visual studio
TangKenny24 分钟前
基于EasyExcel的动态列映射读取方案
java·easyexcel
2503_9284115624 分钟前
10.30 MySQL数据表操作
数据库·mysql
安冬的码畜日常26 分钟前
【JUnit实战3_19】第十章:用 Maven 3 运行 JUnit 测试(下)
java·测试工具·junit·单元测试·maven·junit5
lemon_sjdk36 分钟前
软件开发模式架构选择
java·架构·软件开发·前后端分离
weixin_307779131 小时前
C#程序实现将Teradata的存储过程转换为Snowflake的sql的存储过程
数据库·数据仓库·c#·云计算·迁移学习
李高钢1 小时前
c#获取当前程序所在目录避坑
开发语言·数据库·c#
Victory_20251 小时前
c# stateless介绍
c#
董广明1 小时前
单元测试(JUnit、Mockito、PowerMock )
java·经验分享·junit·单元测试