
2.2 数据来源与变量定义
2.2.1 数据来源
本研究从不同来源获取公开和非公开数据。账户交易数据包含投资者所有的交易和订单记录。通过投资者身份代码,我们可以区分每笔交易的双方是来自个人账户或机构账户,订单序列号允许我们确定是哪一方发起了交易。
中国资本市场的机构投资者包括共同基金、社会保障基金、合格境外机构投资者(QFII)、企业年金基金、券商、公司和组织。中国证券登记结算公司(China Securities Depository and Clearing Corporation)的统计数据显示,截至2005年底,个人投资者持有全部股票价值的69.87%。在过去的几年里,个人投资者一直是中国股市的主导力量。但截至2008年底,机构投资者持有A股总流通股市值的54.62%,这是机构投资者持股比例首次超过50%的里程碑式水平。
对于样本中的每一只股票,我们从中国股市和会计研究数据库(CSMAR)收集到了收益、成交量、市值、账面价值、资产收益率(ROA)、杠杆率、每股收益(EPS)、现金流量(CF)和分析师覆盖率信息。其中,CSMAR是中国领先的金融数据提供者。
所有连续变量均在3%和97%进行缩尾处理,这在中国股市中非常重要(Shen,Luo and Huang,2015)。最后,本书样本包括874只股票和12580个盈余事件。
2.2.2 变量定义
(1)投资者交易行为。
为了刻画每一组投资者的交易行为,参照Han和Kong(2017)以及Kaniel等(2008),我们使用订单不平衡程度捕捉各类投资者的买卖订单压力。对于每一种投资者类型,我们得到t日股票的总买入和总卖出量,从买入量中减去卖出量,然后除以过去一年的日平均交易量。我们计算当天执行的买卖的净买入量(NB)为

其中,NBk,i,t表示k类投资者在t日对于股票i的净买入量,Buyk,i,t表示k类投资者在t日买入股票i的总量,Sellk,i,t表示k类投资者在t日卖出股票i的总量,分母是过去一年的日平均交易量。在本章,k代表个人投资者、机构投资者、主动型机构和被动型机构,我们只考虑被执行的交易规模。
与Kaniel等(2012)类似,我们使用超额NB(ANB)作为投资者在盈余公告前交易行为的代理测度。当计算各类型投资者的净买入量时,我们以整个市场上该类投资者的平均交易水平为基准进行调整。具体而言:

其中,MktNBk,t为第t个交易日k类投资者在市场上的平均净买入程度。
接着,我们将[t1,t2]期间的累计超额净买入定义为

(2)累计异常收益。
为了描述公告期间投资者反应,我们计算了某一期间上的累计异常收益。我们将事件日(T0)定义为盈余公告日,估计窗为[T0-240,T0-61]。股票i在事件窗上的CAR定义为:

其中,ARi,t为股票i在时点t的日异常收益率。我们利用估计窗口的交易数据,使用市场定价模型Ri,t=αi+βiMRt+εi,t得到估计系数、
。然后,使用方程式
计算事件窗口中股票i的ARi,t,估计t时点股票i的异常收益。
(3)未预期盈余。
为了衡量未预期盈余,我们使用简单时间序列模型(naïve time-series model)进行估计。与之前的许多研究一致,我们将未预期盈余定义为实际盈余减去预期盈余,并用股票价格或未预期盈余的标准差进行调整(2)。
简单时间序列估计通常是基于滚动随机游走模型,该模型由Foster、Olsen和Shevlin(1984),Bernard和Thomas(1989),Livnat和Mendenhall(2006)提出。具体而言,我们将SUE定义为:SUEj,T=UEj,T/Std(UEj,T),代表公司j在T期的标准未预期盈余。UEj,T为未预期盈余,Std(UEj,T)为前8期的未预期盈余标准差。UEj,T=(AEj,T-AEj,T-4)/|AEj,T-4|,其中,AEj,T表示公司j在T期的实际每股收益,|AEj,T-4|为公司在T-4期实际每股收益的绝对值。Foster等(1984)指出,与其他更精确的模型相比,简单时间序列模型提供了相同的结论。
(4)盈余管理水平。
与其他盈余管理相关的研究一样,我们采用非正常性应计利润(DAs)作为盈余管理的主要代理变量。盈余有两个主要组成部分,即现金流量和会计调整(应计利润)。应计利润极易受到管理层的影响,因为应计利润的符号和规模的确定需要管理层的判断和估计。然而,并非应计利润都源于盈余管理。鉴于行业和经营状况,必须定期进行某些应计利润调整。因此,应计利润总额可以进一步分解为两部分,即正常性应计利润(NDA)和DA。考虑到本章研究需要,我们在研究中使用了DA的绝对值。
我们采用修正的琼斯模型(MJones)作为盈余管理的第一个代理(Jones,1991;Dechow,Sloan and Sweeney,1995)。为了估计DAs,我们按照标准产业分类(SIC)代码的前两位数划分行业,在每个行业—年度内采用最小二乘回归进行估计,估计系数,
和
:

其中,i表示企业,t表示时间,TAit表示企业i在t年度的营业利润与经营活动净现金流的差额,ΔREVit表示企业i在t年度的营业收入与t-1年度营业收入的差额,PPEi,t表示企业i在t年度的固定资产净值。所有的变量都按期初总资产的比例缩放。
然后,我们使用估计值,
和
计算NDAs,如下:

其中,ΔARit表示企业i在t年度应收账款与t-1年度应收账款的差额。
然后,我们得到DA如下:

盈余管理的第二个测度EM_ROA,是经业绩匹配的DA(Kothari,Leon and Wasley,2005)。我们使用方程(2-5)进行回归,得到残差值(即DA)。然后,在每个SIC行业内,按照企业同期ROA进行排序分为10组,计算相同组的平均DA程度(用中位数衡量),以调整不同公司业绩之间的差异。EM_ROA则定义为企业DA与
之差的绝对值。
(5)控制变量。
根据前人的研究成果,我们还控制了以下变量:Size是总资产的自然对数;BM是账面价值与市场价值的比率;TO是本财政季度的股票周转率;Leverage是负债总额与总资产的比率;ROA是通过将公司的年度收益除以其总资产来计算的。
2.2.3 描述性统计
表2-1列示了主要变量的分布情况。鉴于交易数据涵盖2005年至2008年,本章考察2004年第四季度至2008年第三季度的季报披露。结果显示,整体而言,在盈余公告之前,个人投资者倾向于成为净买方,机构投资者倾向于成为净卖方。然而,[T0-3,T0-1]的平均累计异常收益为负,这表明整体而言,机构投资者在坏消息发布之前售出股票。
表2-1 描述性统计

值得注意的是,投资者行为的衡量标准(即NB或CNB)是根据整个市场以及市场中机构和个人之间发生的所有交易来确定的。机构投资者(无论是主动型机构投资者还是被动型机构投资者)的交易行为与个人投资者的交易行为相反,这就解释了为什么CNBinst和CNBind是相反的。