grouped.get_group((‘B‘, ‘A‘))选择分组

1. df.groupby(['team', df.name.str[0]])

  • df.groupby(['team', df.name.str[0]]) 这一部分代码表示对 DataFrame df 按照 两个条件 进行分组:

    • 按照 'team' 列(即团队)。
    • 按照 'name' 列的 首字母df.name.str[0])。
  • df.name.str[0] 使用了 str 访问器和 .str[0] 索引来获取 'name' 列中每个名字的首字母。例如,如果某个名字是 "Alice",那么 df.name.str[0] 就会返回 'A'

  • 因此,分组后的结果是按团队(team)和每个人姓名的首字母进行二重分组。

2. grouped2.get_group(('B', 'A'))

  • grouped2.get_group(('B', 'A')) 表示从已经按 teamname 首字母分组的结果中,选出 teamB 且姓名首字母为 A 的组。
  • get_group(('B', 'A')) 方法返回的是符合条件的组的 DataFrame 数据。

示例:

假设你有如下的 DataFrame df

python 复制代码
import pandas as pd

# 创建一个示例 DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
    'team': ['A', 'B', 'A', 'B', 'A'],
    'score': [90, 80, 85, 95, 88]
}
df = pd.DataFrame(data)

print(df)

输出:

复制代码
      name team  score
0    Alice    A     90
1      Bob    B     80
2  Charlie    A     85
3    David    B     95
4      Eva    A     88

执行 grouped2 = df.groupby(['team', df.name.str[0]])

python 复制代码
grouped2 = df.groupby(['team', df.name.str[0]])

这将按照 team 和姓名首字母进行分组,得到一个分组对象。现在,grouped2 是一个包含多个组的 GroupBy 对象。

执行 grouped2.get_group(('B', 'A'))

python 复制代码
grouped2.get_group(('B', 'A'))

这行代码会选出 teamB 且姓名首字母为 A 的分组。输出将是:

复制代码
    name team  score
1    Bob    B     80

解释:

  • teamB 且姓名首字母为 A 的数据只有 Bob,因此返回的结果是一个 DataFrame,其中只包含 Bob 这一行数据。

完整代码

python 复制代码
import pandas as pd

# 创建一个示例 DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
    'team': ['A', 'B', 'A', 'B', 'A'],
    'score': [90, 80, 85, 95, 88]
}
df = pd.DataFrame(data)

print(df)

grouped2 = df.groupby(['team', df.name.str[0].str.upper()])  # 确保首字母是大写
print(grouped2.groups)

grouped2.get_group(('B', 'B'))

输出:

总结:

  • df.groupby(['team', df.name.str[0]]) :按团队 (team) 和姓名的首字母 (df.name.str[0]) 进行二重分组。
  • get_group(('B', 'A')) :获取 teamB 且姓名首字母为 A 的分组数据。在本例中,只有 Bob 这一行符合条件,因此返回该行数据。

这种方法非常有用,可以实现更复杂的分组,比如按某一列的部分值(如首字母、日期的月或周等)进行分组。

补充:

分组对象的groups方法会生成一个字典(其实是Pandas定义的PrettyDict),这个字典包含分组的名称和分组的内容索引列表,然后我们可以使用字典的.keys()方法取出分组名称:

python 复制代码
import pandas as pd

# 创建一个示例 DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
    'team': ['A', 'B', 'A', 'B', 'A'],
    'score': [90, 80, 85, 95, 88]
}
df = pd.DataFrame(data)

print(df,'\n')
grouped = df.drop('name', axis=1).groupby('team')
result = grouped.sum()
print(result,'\n')
print(df.groupby('team').groups,'\n')
print(df.groupby('team').groups.keys(),'\n')

输出:

相关推荐
大翻哥哥23 分钟前
Python 2025:量化金融与智能交易的新纪元
开发语言·python·金融
zhousenshan2 小时前
Python爬虫常用框架
开发语言·爬虫·python
IMER SIMPLE2 小时前
人工智能-python-深度学习-经典神经网络AlexNet
人工智能·python·深度学习
CodeCraft Studio2 小时前
国产化Word处理组件Spire.DOC教程:使用 Python 将 Markdown 转换为 HTML 的详细教程
python·html·word·markdown·国产化·spire.doc·文档格式转换
专注API从业者3 小时前
Python/Java 代码示例:手把手教程调用 1688 API 获取商品详情实时数据
java·linux·数据库·python
java1234_小锋3 小时前
[免费]基于Python的协同过滤电影推荐系统(Django+Vue+sqlite+爬虫)【论文+源码+SQL脚本】
python·django·电影推荐系统·协同过滤
看海天一色听风起雨落4 小时前
Python学习之装饰器
开发语言·python·学习
XiaoMu_0014 小时前
基于Python+Streamlit的旅游数据分析与预测系统:从数据可视化到机器学习预测的完整实现
python·信息可视化·旅游
THMAIL4 小时前
深度学习从入门到精通 - 生成对抗网络(GAN)实战:创造逼真图像的魔法艺术
人工智能·python·深度学习·神经网络·机器学习·生成对抗网络·cnn
我没想到原来他们都是一堆坏人5 小时前
(未完待续...)如何编写一个用于构建python web项目镜像的dockerfile文件
java·前端·python