用讲故事的方式学Pandas的数据结构之DataFrame

在一个遥远的数据王国里,有一个被称为"DataFrame"的魔法图书馆,这个图书馆非常独特,因为它是由一系列叫做"Series"的魔法书架组成的。每个书架都拥有自己的名字和一串神秘的数字,这些数字是王国里各种知识和秘密的代码。图书馆的设计初衷是将"Series"的魔法从一维世界拓展到了二维的奇妙空间,让寻求知识的人们可以更加方便地查找和组织信息。

在图书馆的中心,有一个巨大的索引表,称为"index",它记录了每一行书架的名字。而在图书馆的入口,挂着一块巨大的指示牌,上面写着每一列书架的名称,这被称为"columns"。每当有人想要查找知识时,他们只需要根据行和列的索引就能找到他们所需的信息,这些信息被储存在一个叫做"values"的神秘二维阵列中,这就是图书馆的核心所在。

有一天,一个叫做"DataFrame"的年轻学者来到了这个图书馆。他决定用一种全新的方式来记录王国里的知识。他带来了一本空白的大书,这本书就是他的"DataFrame"。他开始从各个书架上收集信息,把这些信息按照一定的顺序排列,每一列都有自己的标题,就像是把一系列"Series"汇聚到一起形成了一个更加强大的知识库。

DataFrame学者知道,要创建一个有用的大书,最常见的方法是用一个巨大的字典,字典的键是列的名称,字典的值是一串神秘的数字,代表着那一列的知识。他小心翼翼地将这个字典放入大书中,魔法般的,大书自动为每一行加上了索引,就像魔法图书馆中的"index"一样。

在这个过程中,DataFrame学者遇到了一些挑战,比如有时他发现有些列的名称在他的字典中找不到,那些位置上的信息就会变成了"NaN",表示那里是未知的或丢失的知识。

在完成了他的大书后,DataFrame学者用一种特殊的魔法查看了它的结构,他发现大书中的知识是如何通过行("index")和列("columns")来组织的,他也能看到整个大书的形状("shape"),以及藏在大书中的所有知识("values")。

为了继续他的研究,DataFrame学者决定进行一个练习。他创建了一个新的DataFrame,名为"df",记录了两位学生在不同科目上的考试成绩。他用这个小型的DataFrame来测试他对这个强大工具的理解和掌握,从而为王国的知识贡献了他自己的一份力量。 在一个叫做"索引之城"的地方,有一座非常特殊的图书馆,这座图书馆里藏有无数的书籍,它们记录了城市的历史、知识和秘密。图书馆的管理员是一位非常聪明的老者,名叫DataFrame。DataFrame老者有一本神奇的大书,这本书就是他管理图书馆的关键。

一天,一个年轻的探险者来到了索引之城,他的名字叫做索引者。索引者对DataFrame老者的大书非常好奇,他想要了解如何从这本大书中找到自己需要的知识。DataFrame老者便开始向索引者展示如何使用这本神奇的大书。

首先,DataFrame老者展示了如何对列进行索引。他告诉索引者,可以通过两种方式获取书中的列,就像寻找一本特定的书一样。一种方式是类似于使用字典的键,就像说出书的名字一样。另一种方式是通过属性的方式,就像通过书的特征来找到它。无论哪种方式,找到的都是一系列的知识,这在图书馆中被称为"Series"。DataFrame老者解释说,每当通过列名找到一列时,实际上就是从大书中取出了一本书,这本书沿用了大书相同的索引,名字也是那个列的名称。

接着,DataFrame老者展示了如何对行进行索引。他告诉索引者,可以使用.loc[]和.iloc[]这两种魔法工具来寻找特定的行。通过.loc[],就像是通过书架上的标签来找书,而通过.iloc[],则像是数着第几本书来找。不管用哪种方法,找到的都是一个记录了所有列信息的Series,就像是从书中提取了一段知识。

最后,DataFrame老者教导了如何对元素进行索引,这就像是在书中找到特定的一句话。可以通过列索引、行索引或直接使用书中的知识------二维的神秘阵列,也就是values属性来达成目的。无论是通过列名加行索引的方式,还是先指定行后指定列,都能精确找到大书中的某个知识点。

在这次学习中,索引者还练习了使用不同的方法对大书进行索引和切片,发现每种方法都有其独特之处,但都遵循一个基本的原则:明确你要找的是哪一行哪一列的知识。

在一个名为"运算谷"的神奇地方,有两座巨大的塔楼,一座叫做"月考一塔",另一座叫做"月考二塔"。每座塔楼都住着一群学生,他们的成绩被记录在塔楼的石板上。月考一塔的石板上记录着张三、李四、王五、赵六、田七的成绩,而月考二塔除了这些学生外,还多了一个名叫孙八的新学生。

两座塔楼的守护者,DataFrame大法师,掌握着一种强大的魔法,能够合并两座塔楼的成绩,并计算出学生们的平均成绩。然而,由于孙八只在月考二塔出现,所以在合并时,他的成绩没有与月考一塔的学生进行匹配,导致他的成绩出现了神秘的"NaN"。

为了解决这个问题,DataFrame大法师使用了一种特殊的魔法------"add"魔法,这种魔法可以填补空缺的成绩,让孙八的成绩也能够计入平均成绩中。通过这种魔法,每个学生的成绩都得到了公平的对待。

然而,谷中的故事还没有结束。传说中,张三在期中考试中作弊被发现,需要将他的数学成绩记为0分。DataFrame大法师通过一次简单的魔法操作,轻松地将张三的数学成绩更正。

李四,因为举报张三作弊立下了汗马功劳,作为奖励,所有的科目成绩都增加了100分。DataFrame大法师再次施展魔法,使李四的成绩得到了应有的提升。

在运算谷的最后一幕,大法师发现一个奇妙的现象------有一道题目出错了,为了平息所有学生的不满情绪,他决定给每位学生的每个科目都加上10分。通过施展一次强大的全体加成魔法,每个学生的成绩都得到了增加。

相关推荐
矢量赛奇18 分钟前
比ChatGPT更酷的AI工具
人工智能·ai·ai写作·视频
KuaFuAI26 分钟前
微软推出的AI无代码编程微应用平台GitHub Spark和国产AI原生无代码工具CodeFlying比到底咋样?
人工智能·github·aigc·ai编程·codeflying·github spark·自然语言开发软件
Make_magic35 分钟前
Git学习教程(更新中)
大数据·人工智能·git·elasticsearch·计算机视觉
shelly聊AI40 分钟前
语音识别原理:AI 是如何听懂人类声音的
人工智能·语音识别
源于花海43 分钟前
论文学习(四) | 基于数据驱动的锂离子电池健康状态估计和剩余使用寿命预测
论文阅读·人工智能·学习·论文笔记
雷龙发展:Leah43 分钟前
离线语音识别自定义功能怎么用?
人工智能·音频·语音识别·信号处理·模块测试
4v1d1 小时前
边缘计算的学习
人工智能·学习·边缘计算
风之馨技术录1 小时前
智谱AI清影升级:引领AI视频进入音效新时代
人工智能·音视频
sniper_fandc1 小时前
深度学习基础—Seq2Seq模型
人工智能·深度学习
goomind1 小时前
深度学习模型评价指标介绍
人工智能·python·深度学习·计算机视觉