今天的错题积累内容

在Python的Pandas库中,`++dropna()`方法是用于删除数据中所有的缺失值++(错误原因:没有能够理解这个知识点)。因此,该方法可以删除数据中所有的缺失值,这是正确的。

Pandas中的索引是基于*++Index类创建的++++Index对象++*是不可变的,但可以被不同的++数据结构共享。++

使用 `stack()` 方法后返回的是一个 Series,++但前提是原 DataFrame 有多个级别索引(忽略了前面这个基础的前提条件)。++

2024年6月30日16:34:15-`transform()` 方法可以使用自定义函数,++不仅限于内置方法。++(自己对于这个方法的掌握不是很到位!他不会只是简单的限于内置的方法!)

2024年6月30日16:36:15-`periods` 参数*++用于指定 `date_range()` 函数生成的时间戳数量++*(自己第一个内容没有进行一个实际的理解),当未指定结束日期时,此参数决定生成时间戳的总数。

2024年6月30日16:38:31-++数据标准化通常是指对数值型数据进行标准化处理++,而不是类别型特征。(对于其中的内容没有进行一个良好的理解!)

apply()方法能够实现所有agg方法的功能 -(这个知识点是一个正确的知识点!)

在箱形图中,超出上界和下界的值通常被称为++"异常值"或"离群点"++ 。这里的"上界"和"下界"指的是箱形图的++"须"(whiskers)延伸到的位置++ 。根据定义,++箱形图的须通常延伸到最小值和最大值,但不超过以下范围:++

  • 下须(下界):第一四分位数(Q1)减去1.5倍的四分位距(IQR,即Q3 - Q1)。
  • 上须(上界):第三四分位数(Q3)加上1.5倍的四分位距。

如果数据点++低于下须或高于上须++ ,这些点被认为是++异常值。++ 因此,如果"上界"和"下界"指的是箱形图须的端点,那么这句话是正确的。如果"上界"和"下界"被误解为箱形图的++四分位数(Q1和Q3)++ ,那么这句话++是错误的++。通常在统计学中,箱形图的须是用来确定异常值的位置的。

相关推荐
码农的小菜园几秒前
提示工程学习笔记(一)
笔记·学习
四谎真好看2 分钟前
Redis学习笔记(高级篇3)
redis·笔记·学习·学习笔记
农村小镇哥3 分钟前
PHP递归遍历+MYSQL介绍+MYSQL基本操作
开发语言·mysql·php
阿杰学AI4 分钟前
AI核心知识119—大语言模型之 监督微调 (简洁且通俗易懂版)
人工智能·深度学习·ai·语言模型·aigc·sft·监督微调
九河_6 分钟前
从requirements.txt中安装缺失的包
python·conda·pip·环境管理
llm大模型算法工程师weng7 分钟前
Python爬虫实现指南:从入门到实战
开发语言·爬虫·python
十三画者11 分钟前
【文献分享】TREE通过基于 Transformer 的图表示技术,在生物网络中对癌症基因进行可解释的识别学习
网络·学习·transformer
lly20240613 分钟前
R 绘图 - 函数曲线图
开发语言
君义_noip14 分钟前
信息学奥赛一本通 4164:【GESP2512七级】学习小组 | 洛谷 P14922 [GESP202512 七级] 学习小组
学习·算法·动态规划·gesp·信息学奥赛
AI效率工坊14 分钟前
【Python实战】10万行数据自动清洗:pandas+AI智能识别+异常检测完整方案
人工智能·python·pandas