统计学领域核心术语新解

统计学基础核心概念解析

一、统计方法新论

1、数据描述与推理新探

数据描述(Descriptive Analytics):通过图表、表格和数值形式,对数据特征进行归纳和展示的过程。

案例1:2005年我国性别出生比例失衡,男性与女性比率异常升高至119.92,远超正常水平的106。

案例2:中国经济发展的波动曲线。

数据推理(Inferential Analytics):从整体中抽取部分样本,利用这些样本数据对整体特性进行推断。

总集(Population):统计分析中涉及的所有同类个体的集合。

样本(Sample):从总集中选取的一部分个体。

案例1:2003年人口变动抽样调查覆盖全国,抽取990个县市区、3734个乡镇街道、6544个调查小区的126万人,据此估算全国总人口、出生人口、死亡人口及净增人口。

案例2:大型公司会计部门随机抽取部分发票,以检查整体发票的准确性。

二、数据类型新识

1、分类维度

(1)分类维度(Nominal Scale)

又称命名维度,如性别、民族、职业等,数据表现为类别,无等级次序,可用数字代码表示。

(2)顺序维度(Ordinal Scale)

又称排序维度,如健康状况、质量等级,数据表现为类别,可排序,但不能量化类别间的差距。

(3)间距维度(Interval Scale)

又称间隔维度,如年份、摄氏温度,数据表现为数值,可加减,但“0”仅代表一个数值点,不表示“无”。

(4)比率维度(Ratio Scale)

又称比例维度,如体重、身高,数据表现为数值,可加减乘除,“0”表示“无”。

间距与比率维度的差异在于“0”的含义,实际应用中常不区分。

四种维度的信息含量依次递增,高维度的数据可转化为低维度数据,不同维度的数据需采用不同的展示和分析方法。

三、统计指标新释

统计指标有广义和狭义两种理解:

1、反映现象数量特征的术语,如年末人口数、商品销售额等。

2、反映现象数量特征的术语及其具体数值,如2016年我国国内生产总值。

(1)总量指标

以绝对数形式表现现象规模和水平的指标,分为时点数和时期数。

案例:2007年入境旅游人数、国内生产总值、城镇基本养老保险人数。

(2)时点数与时期数

时点数描述现象在特定时刻的数量表现。

案例:2007年年末全国总人口。

时期数描述现象在特定时间范围内的成果。

案例:2004年货物运输周转量。

区分时点数与时期数的方法之一是看数据加总后是否有意义。

(3)相对数与平均数

相对数是通过两个相关数值对比得到的比值。

平均数反映现象在特定时间或空间上的平均数量水平。

案例:职工平均工资、平均考试成绩。