day10统计师考试(初级)用表格描述数据

用表格描述数据

由于不同类型的数据其特征不同,在利用表格对其进行描述时步骤也不相同,但是无论数据是何种类型,我们都可以使用频数分布表来对其进行描述。

知识点一、非数值型数据的频数分布表 ★

非数值型数据包括分类数据和顺序数据,其本身就是对事物的一种分组。因此,只要先把所有的类别都列出来然后统计出每一类别的数据个数(即频数),进一步就可形成分组列表,即频数分布表。

如将人口按性别分为男、女两组并统计出其各自的频数;按经济类型将企业划分为国有企业、集体企业、私营企业、外商独资企业、中外合资企业等等。

知识点二、数值型数据的频数分布表★

生成数值型数据的频数分布表时,首先是将数据进行分组,然后再统计出各组别的数据频数。

首先,要对数据进行分组。统计分组有"分"与"合

两重含义,即通过统计分组将不同性质的单位区分开来同时把相同性质的单位合并在一起,从而显示出数据的分布特性。

因此,统计分组的关键一是选择分组变量,二是划分各组界限。 分组数的多少要根据数据本身的特点及数据的多少来确定,一般情况下以能够适当观察数据的分布特征为准。

其次,要确定组距。在组数确定的情况下,组距等于全距(全部数据中的最大值与最小值之差)除以组数。

最后,各组的组距是各组的最大差异,即各组变量值中的最大值(即上限,各组中较大的数值)与最小值(即下限,各组中较小的数值)之差。每一组组距都相等的数列称为等距数列,每一组组距不全相等的数列称为不等距数列或异距数列。各组组中值等于上限与下限之和除以2。

即:
各组组距=上限-下限
各组组中值=(上限+下限)/2

在确定组限时,第一组的下限应小于最小值,最后一组的上限应高于最大值。

在确定组距时,一般应当遵循下列原则:

首先,要考虑各组的划分是否能区分总体内部各个组成部分的性质差别。

如果不能正确反映各部分质的差异,必须重新分组。例如,按学生百分制成绩分组,必须要有60分的组限,否则不能反映是否及格的本质区别。

其次,要能准确、清晰地反映总体单位的分布特征。在确定组距时,当研究的现象变动比较均匀时,可以采用等距分组;

而当研究的现象变动很不均匀时,例如急剧的增长或急剧的下降,波动的幅度很大时,则一般采用不等距分组。

最后,统计出各组的频数得出频数分布表。在统计各组频数时,若相邻两组的上下限重叠,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内,即采取上限不在内的原则,以保证一项数据只被分在某一组。

例题

【单选题】当一组数据变动比较均匀时,对其分组宜采用(C)。

A.极大值分组

B.极小值分组

C.等距分组

D.不等距分组

相关推荐
上课不要睡觉了3 天前
day07统计师考试(初级)用统计量描述数据
统计·统计师考试
上课不要睡觉了5 天前
day06统计师考试(初级)数据的误差
统计·统计师考试
上课不要睡觉了6 天前
day05统计师考试(初级)政府统计组织体系
统计·统计师考试
上课不要睡觉了8 天前
day04统计师考试(初级)统计法的立法目的
统计·统计师考试
上课不要睡觉了10 天前
day01统计师考试(初级)统计学的含义及其应用
统计·统计师考试
QH_ShareHub24 天前
双重稳健估计模型
统计
刘大猫.3 个月前
XNMS项目-mysql数据库同步
数据库·统计·同步·数据同步·数据统计·数据库同步·业务统计
有为少年3 个月前
PyTorch 的统计三剑客:bucketize, bincount 与 histogram
pytorch·python·学习·机器学习·统计
Zhibang Yue3 个月前
非参数统计基础1——Pearson检验
统计·概率论·数理统计