国学经典,永久流传《诗经朗诵全集》
《诗经朗诵全集》带你领略国学经典,永久咏传。...
2023-07-31
在学习统计学时,人们可能过于注重分析方法的使用,而忽视了数据收集和整理的重要性。一般来说,统计分析最重要的一步,其实就是把数据组织成便于分析的数据形式,比如下表:
虽然上表全是数字,但是可以回答很多问题。比如:大家都多大了?什么程度?婚姻状况如何?就业情况如何?家里有几口人?
这些问题的答案都是我们考察的对象的一系列特征或属性,统计学上称之为变量,也就是上表顶行的项目名称。统计学初学者一定要训练自己用“变量”来表达自己。
每一个被考察的对象称为一个观察单元(案例或观察),变量是观察单元的某种特征或属性,变量的具体值称为“变量值”。
所以上表中一系列问题对应的变量有:年龄、学历、婚姻状况、就业、家庭规模、ABO血型等。
进一步的观察表明,一些变量的值,如年龄和家庭规模,是具体和有意义的值。有些变量的值,比如学历、婚姻状况,是用数字表示的,但其含义只是一个“代号”,需要特定的词语来定义,比如“0=未婚,1=已婚”。
因此,年龄、家庭规模等变量的值是定量的、有计算意义的,我们称之为数量变量);。
学历、婚姻状况、就业状况等变量的值是定性的,主要起代码的作用,称为定性变量。
深圳生活网
另一方面,为了对定性变量进行统计处理,往往需要对其进行编码,比如“0代表男性,1代表女性”。因此,在实际的统计工作中,要避免输入汉字,而要注意转换成相应的数字。
甚至可变的名字,比如上面提到的“编号、年龄、学历等。”,应尽量用英文或中文表示,以避免统计软件出错。
进一步思考后会发现,年龄、人口等变量一般都有单位,不同人的年龄差异理论上可以无限小,比如1年、1个月、1天、1小时、0.1小时、0.01小时...
所以理论上年龄变量的取值范围可以取任意正实数,但是注意不是正整数。比如一个人的年龄可以记录为17.55岁,也就是说年龄是17岁6个月18天,甚至出生时间的信息也可以用来精确到更小的时间单位(比如“分、秒”)。所以这类变量被称为连续变量,主要是因为理论上它的取值范围是连续的。
相反,家庭人口的变量是另一种连续变量,即离散变量,因为不同家庭的人口只能相差0,1,2,而不能相差1.1,1.2等。,其取值范围是间歇的、不连续的。
可见,只有数量变量一般分为连续和离散,即一个数量变量要么是连续的,要么是离散的。
相比较而言,定性变量在数据表达方式上与离散变量相似,但深圳生活网只对其有“代号”的含义,所以一般不将其视为离散变量。
另外,定性变量的值往往呈现出不相交的类别(所以定性变量也叫分类变量),这些类别之间有时会有细微的差别。
例如,教育背景等定性变量的值为“文盲、小学、初中、高中……”,它透露出一种等级或秩序感,所以又叫有序分类变量,意思是其值的不同类别之间存在程度差异。
另一个常见的例子是“满意度”,包括“非常不满意、不满意、一般、满意、非常满意”。这种有序的分类变量给人一种“半定量”的感觉,也称为“等级变量”;
相比之下,另一类定性变量,即障碍分类变量,其值没有程度差异,如性别、血型等。
无序分类变量根据取值不同可分为“二项式分类变量”和“多分类变量”。比如性别(一般)只能分为男性和女性两类,所以称为第二类,而血型有很多,可以称为多类。
要明确各种变量的含义,还需要了解各种类型的变量是可以转换的。
比如血压值一般记为定量变量,但其可按照一定的临床标准,将其转换为定性变量,例如根据血压值分为:正常血压( 收缩压
以上内容就是为大家推荐的变量是什么(统计学变量可分为哪几类)最佳回答,如果还想搜索其他问题,请收藏本网站或点击搜索更多问题
内容来源于网络仅供参考版权声明:所有来源标注为小樱知识网www.cnfyy.com的内容版权均为本站所有,若您需要引用、转载,只需要注明来源及原文链接即可。
本文标题:变量是什么(统计学变量可分为哪几类)
本文地址:https://www.cnfyy.com/shcs/420468.html
相关文章
热点文章
2021年独生子女补贴新政策是真的吗(独生子女证有有效期吗)
2021年国庆节阅兵仪式几点开始几点结束(2021年国庆节还有阅兵吗)
鼠目寸光一点红是什么生肖动物(鼠目寸光一点红)指什么生肖,紧密
k0到k9的玩法大全(强制gc的玩法和注意事项)
入土为安是什么生肖《入土为安》打一个生肖动物,词语解释
浙江12月底全面停工是真的吗(浙江什么时候放假停工)
如何做t(t怎么把p做哭)
北京口碑最差的三甲医院(北京301医院最擅长什么)