变量的概念(统计学四种变量类型)

任何研究的目的在探索或证实自然现象中各个因素间的一些相互关系或因果关系,在实验设计及操控进行的过程中,必须仔细安排这些因素以探索或测试它们之间的相互关系。这些安排包括排除不必要的因素与操控某个特定因素等。这些因素在研究设计上称之为「变量」,因为在研究操控进行的过程中,这些因素会因条件状况的不同而改变。

变量是通过数据(data) 来呈现,数据则是经由搜集、分析及汇总所得到,用以说明或解释之用的事实与数值。为特定研究目的所搜集的所有数据则称为数据集(data set)。所以变量是所收集的数据的一种特性。

变量可以定义为是某一自然现象实际的特质,这个特质有时可以两个或两个以上的数值来量化。而且变量的另一个重要特性是它们的存在本质可分为连续(continuous)和离散(discrete)两类,这个特性对研究的测量程序、数据分析和推论及概括的方法有很大的影响。测量尺度(scale of measure)或称度量水平(level ofmeasurement)、度量类别,是统计学和定量研究中,对不同种类的数据,依据其尺度水平所划分的类别。以类型区分,数据可分为计质(Qualitative,定性,质量)与计??(Quantitative,定量,数量)??种。

品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表现,数量标志表明总体单位数量方面的特征,其标志表现可以用数值表示,即标志值。

统计指标是反映社会经济现象总体综合数量特征的科学概念或范时。统计指标反映现象总体的数量特征一个完整的统计指标应该由总体范围、时间、地点、指标数值和数值单位等内容构成。统计指标和统计标志是一对既有明显区别又有密切联系的概念。

指标是说明总体特征的,标志是说明总体单位特征的;指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性

进一步细分,则

变量数据结构如下图

变量的概念(统计学四种变量类型)

名目尺度一般是以标记或名称来表示相同类的区别,像性别、产业别、公司别,当然名目尺度也可以通过数值来代替,只是那些数是没有任何数字意义的。

若名目尺度的数据是有顺序的,那此变量则成为次序尺度。像惠誉国际信用评等的衡量尺度就属于次序尺度,从AAA到D共11级的评等标记,其他国际信用评等公司的评等尺度如下表

一般次序尺度都会用数值符号来表示,举例来说大学排名也是次序尺度的一种。名目尺度、次序尺度都属于类别数据(categoricaldata)或称定类数据。

如果变量具备名目尺度的特性,而且观察值之间的间隔有固定的衡量单位,那变量的尺度就变成等距尺度像温度。

如果等距尺度的观察值之间的比例是有意义的,那就变成等比尺度,像会计科目里面的所有数据、经济数据都是属于等比尺度。等距尺度和等比尺度是定量数据(quantitativedata)定量数据根据数据是否可数,分为离散的和连续的。

定量数据是以精确的数字形式出现,所以理论在很大程度上是具备因果性和演绎性,也就是在数字运算后结果还是有意义,所以定量数据可以通过用统计数值和图表,以及探讨它们与假设的关系来进行分析。而定性数据的概念以主题、宗旨、概括和类型的形式出现,理论不一定是因果性,但通常是归纳的方式存在,分析的过程是通过从例证中抽取出主题或概要和组织资料来展现一个紧凑的、一致的图画,当然若定性资料若以类型方式存在,还是可以透过数据来处理(虚拟变量,請見拙著”财经应用统计学[M]. 北京:首都经贸大学出版社. 2021.02(预计)”于第11章进行介绍)。

整体来说,尺度是可以降级的,也就是等比尺度可以变成等距尺度甚至变成次序尺度,像上面信评公司国家主权和企业行用评等评级平级过程都是通过等比尺度的计算最后再利用次序尺度呈现出来。

统计分析研究,可以分成分类数据分析和计量分析(这都已经构成不同的学科了),而财经的研究大不分都属于计量分析,一般计量分析的数据通常也会希望是连续型的数据,不过财经数据往往呈现不连续的状况,所以在研究过程中数据的转换变成一个相当不错的研究工具,最常用的转换方法是将变量取自然对数,基于对数函数在其定义域内是单调增函数,取自然对数后不会改变数据的相对关系,取自然对数作用主要有:

1. 缩小数据的绝对数值,方便计算:每个数据项的值都很大,许多这样的值进行计算可能会超过常用数据类型的取值范围,这时取对数,就把数值缩小了。

2. 取对数后,可以将乘法计算转换为加法计算:某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。也就是说,对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。则对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。这也是符合生活常识的,例如对于价格而言,当购买家电时,价格相差的几百块能够很大程度影响消费者决策,但如果是购买汽车时相差几百块钱的情况下消费者通常会选择忽略不计。

3.在经济学中,常取自然对数再做回归,所到的系数解正好是弹性的定义。

此外取对数之后不会改变数据的性质和相关关系,但压缩了变量的间隔,数据更加平稳,也消弱了模型的共线性、异方差性等。这些属性都会在后面的章节一一介绍。

前期文章

实证写作篇

实证论文基本架构文献搜寻文献综述写作财金類頂級期刊

财务金融篇

财务七大理论财务管理(Management of Finance)的范畴会计、审计、财务管理傻傻分不清楚

计量方法篇

自然底数(数学常数)

正态分布概率等于1的证明

正态分布后续,敬请期待

财务金融篇

财务金融的基本理论-投资组合理论财务金融的基本理论-资本结构理论财务金融的基本理论-资本资产定价模型财务金融的基本理论-效率市场假说财务金融的基本理论-期权定价理论财务金融的基本理论-信息不对称理论财务金融的基本理论-代理理论……

计量方法篇

变量的种类描述统计量与EViews的操作二元正态分布抽样分布抽样分布-卡方分布抽样分布-t分布抽样分布-F分布检验-平均数单总体检验-平均数双总体检验-方差单总体检验-方差双总体回归分析多元回归虚拟变量ANOVA时间序列分析……

实证写作篇

发表评论

登录后才能评论