今天的错题积累内容

待2024-06-30 23:42

在Python的Pandas库中，`++dropna()`方法是用于删除数据中所有的缺失值++（错误原因：没有能够理解这个知识点）。因此，该方法可以删除数据中所有的缺失值，这是正确的。

Pandas中的索引是基于*++Index类创建的++，++Index对象++*是不可变的，但可以被不同的++数据结构共享。++

使用 `stack()` 方法后返回的是一个 Series，++但前提是原 DataFrame 有多个级别索引（忽略了前面这个基础的前提条件）。++

2024年6月30日16:34:15-`transform()` 方法可以使用自定义函数，++不仅限于内置方法。++（自己对于这个方法的掌握不是很到位！他不会只是简单的限于内置的方法！）

2024年6月30日16:36:15-`periods` 参数*++用于指定 `date_range()` 函数生成的时间戳数量++*（自己第一个内容没有进行一个实际的理解），当未指定结束日期时，此参数决定生成时间戳的总数。

2024年6月30日16:38:31-++数据标准化通常是指对数值型数据进行标准化处理++，而不是类别型特征。（对于其中的内容没有进行一个良好的理解！）

apply()方法能够实现所有agg方法的功能 -（这个知识点是一个正确的知识点！）

在箱形图中，超出上界和下界的值通常被称为++"异常值"或"离群点"++ 。这里的"上界"和"下界"指的是箱形图的++"须"（whiskers）延伸到的位置++ 。根据定义，++箱形图的须通常延伸到最小值和最大值，但不超过以下范围：++

下须（下界）：第一四分位数（Q1）减去1.5倍的四分位距（IQR，即Q3 - Q1）。
上须（上界）：第三四分位数（Q3）加上1.5倍的四分位距。

如果数据点++低于下须或高于上须++ ，这些点被认为是++异常值。++ 因此，如果"上界"和"下界"指的是箱形图须的端点，那么这句话是正确的。如果"上界"和"下界"被误解为箱形图的++四分位数（Q1和Q3）++ ，那么这句话++是错误的++。通常在统计学中，箱形图的须是用来确定异常值的位置的。