第三节 数据来源及数据处理
一 数据来源及处理
本报告绝大部分四级指标直接从统计资料中获得,少部分四级指标在原始统计数据的基础上经简单数学运算得到。
为了避免指标属性的不统一给因子分析带来误差,对本报告所有指标进行同向化和标准化处理。
同向化为了排除指标方向不同所带来的误差,实证分析时统一采取正向指标,对于负向指标需要进行正向化处理。标准化处理的意义在于可以解决不同数量级别的数据的不可比问题,经过标准化处理,原始数据均转换为无量纲化指标测评值,即各指标都处于同一个数量级别上,可以进行综合测评分析。数据标准化的方法有很多,本文主要采用“随机变量标准化”,这种标准化方法是对原始数据的非线性变换,使结果服从标准正态,“新数据 =(原数据 -样本均值)/样本标准差”。
二 多指标综合评价方法的选择
金融发展指数评价体系下有多个指标,为了更全面地体现各指标对金融发展指数的影响,本报告将采取多指标综合评价法对其进行分析。多指标综合评价方法可以分为两类:一类是主观赋权法,专家根据经验进行主观判断,衡量各指标的相对重要性,得到指标权重,然后再对指标进行综合评估;另一类是客观赋权法,根据指标数据提供的信息量的大小和指标间的相关性来确定权重,进行综合评价。
影响金融发展的因素错综复杂,很难确定这些因素的影响孰轻孰重。如果在保证研究的客观性以及研究结果的说服力的情况下,通过分析数据特征,从众多因素中找出少数几个影响金融发展的关键因素,将大大有利于金融发展指数研究的简化。因此,经过综合比较,本报告最终选择了因子分析方法作为衡量金融发展指数的方法。
因子分析的目的是用几个不可观测的隐变量来解释原始变量之间的相关关系。它是主成分分析的推广和发展。降维是它的核心思想。因子分析方法的具体步骤为:首先,将原始数据进行标准化变换,求相关矩阵或协方差矩阵R的特征值和特征向量;随后建立因子模型并估计有关参数,来确定因子贡献率及累计贡献率;最后,变换因子载荷矩阵,构造综合评价模型,最终计算出总得分值。