论文部分内容阅读
摘要:根据我国证监会2001年颁布的《公开发行证券公司信息披露编报规则第9号—净资产收益率和每股收益的计算及披露》及《公开发行证券的公司信息披露规范问答第1号—非经常性损益》,收集2001-2006年度的样本数据,以4年期为时间窗口采用行业水平下滚动随机系数回归分析了基于扣除非经常损益后的盈余结构的五个时间序列ROE预测模型的预测能力及其信息含量。结论表明,修正的ROE模型预测能力及其信息含量最优;CASHFLOW模型预测其信息含量最差。结论支持我国证券会上述两个文件能够实现其目的。
关键词:非经常性损益;盈余分解;ROE;预测能力;精确性;相关性
在研究净利润结构时,考虑到上市公司利用非经常性项目操纵净盈余。为了实现真实、准确反映上市公司盈利能力,客观评价公司的盈利水平;为进一步规范上市公司信息披露行为,提高上市公司财务信息披露的质量,保护投资者的合法权益;为准确考核上市公司、拟发行上市公司的盈利能力等目的,我国证监会制定了《公开发行证券公司信息披露编报规则第9号—净资产收益率和每股收益的计算及披露》,该规则要求计算扣除非经常性损益后的净利润,但并没有明确界定非经常性损益。由于证券会在相关融资法规及多项信息披露规范中使用了“非经常性损益”的概念,但这些规范未对这个概念的内涵、外延给出清晰的界定,公司对此理解不一,具体执行时往往采用不同的判断标准,导致公司对所披露“扣除非经常性损益的净利润”等财务指标的计算可能不准确,相互间也缺乏可比性。2001年4月25日证监会颁布了《公开发行证券的公司信息披露规范问答第1号—非经常性损益》,对非经常性损益的含义和内容作了较为清晰的界定。但从执行的情况看,无论是其披露还是涉及项目的认定方面均存在差异,出现公司根据自己的需要增加减少非经常性损益项目的现象。为此,证监会明确界定了非经常性损益的含义和内容。该问答指出非经常性损益概念及其包括的内容。为了研究非经常性损益对上市公司持续盈利能力及其派生财务指标的影响,我们借鉴了国内外学者研究扣除非经常性损益后的盈余的研究方法,再次研究了五个时间序列预测模型对扣除非经常性损益后的盈余及其派生财务指标的预测能力及其信息含量。为此,我们不仅研究了包括非常项目的净利润结构预测未来期间的盈余及其派生指标情况,而且还研究了扣除非常项目后的净利润结构预测未来期间的盈余及其派生指标情况。
一、ROE预测能力及其信息含量的时间序列模型
我们通过比较仅以滞后ROE数据为基础预测ROE的基本ROE模型、以滞后的经营性收益和非经营性收益分解为基础预测ROE的OPINC模型、以滞后的现金流量和应计利润组成部分为基础预测ROE的CASHFLOW模型、以滞后ROE及公司盈余是否亏损为哑变量预测ROE的LROE模型以及以成本性态为基础预测ROE的CVCS模型在预测ROE的精确程度来度量各个模型在预测ROE的优劣。我们所考查的这五个时间序列模型如下:
ROE模型:ROEt=γa0+γa1ROEt-1+εt{1}
OPINC模型::ROEt=γb0+γb1OPINCt-1+γb2NOPTAXt-1+εt{2}
CASHFLOW模型:ROEt=γc0+γc1CFOt-1+γc2ACCREALSt-1+εt{3}
CVCS模型:ROEt=γd0+γd1DECRDUMt+γd2ROEt-1+γd3SALESt-1+γd4SALESt-1
*DECRDUMt+εt{4}
LROE模型:ROEt=γe0+γe1LOSS+γe2ROEt-1+γe3LOSS*SALESt-1+εt{5}
模型中,LOSS=1,如果ROE■<00,如果ROE■≥0
我们运用行业水平随机系数回归来估计五个模型并考虑了每个行业模型对公司的随机异质性。对每个公司的系数具有随机差异并对每个行业来说服从均值和方差的独立分布。以方程{4}为例来说明这一点,方程{4}的系数集假定服从下面的随机结构。■,i=0,1,......,n。对方程{1}来说,n=1;对方程{2}来说,n=2;同理,对方程{3}来说,n=2;对方程{4}来说,n=4;对方程{5}来说,n=3。在这里,■是某一特定公司所处行业的均值,它是一个常数。■服从N(0,σ2IND),是指特定公司偏离行业均值的误差。每一个■服从一个均值为0和该公司所处行业方差为σ2IND的正态分布。我们运用混合样本,在任何时期T里,对每个公司都存在没有解释ROE的方差εt。运用随机系数回归方法估计这些系数时,相似随机结构的影响也存在其他几个时间序列模型中。这样做的目的是为了在可比的基础上评价时间序列模型的预测能力及其信息含量。
按照Fairfield等(1996)和Banker等(2006)的方法,用数学方法来说明随机系数回归的系数估计集合时,可以用以下方程表示:γ^di=γ^■+δ^■,i=0,1,...,4。γ^■表示估计的行业均值,δ^■表示每个单独公司偏离行业均值的估计方差。
二、文献回顾与变量定义
(一)文献回顾
本文文献回顾请参考我们于2008年10期发表《财会月刊》(理论版)《ROE预测能力及信息含量研究:回顾与展望》一文,此文不再赘述。
(二)变量定义
我国证券会规定:公司在计算“扣除非经常性损益后的净利润”、“扣除非经常性损益后的净资产收益率”等财务指标时,应扣除非经常性损益的所得税影响数。但是,我们在研究非经常性损益时,由于不能确切地知道每个上市公司所得税税率,因此,我们没有考虑非经常性损益对所得税的影响,而是直接将净利润扣除非经常性损益视为扣除非经常性损益后的净利润,这种处理会导致我们的扣除非经常性损益后的净利润数据与实际应有数据有一定差异。但是,这种非经常性损益对所得税影响的差异不会影响最终结论。
我们定义ROE为扣除非经常性损益后的净利润除以股东权益平均余额;当分母未公布或为零或小于零时,以零表示;股东权益平均余额=股东权益期末余额。SALSES为净销售收入除以所有者权益的期末账面价值;OPINC为经营性收益除以所有者权益的期末账面价值。根据Fairfield(1996)所提出来OPINC模型,该模型涉及两个变量,经营性收益OPINC,它是通过利润表计算得到。Fairfield(1996)将OPINC定义为包括毛利、销售费、一般性的管理费、折旧费、利息费和少数股东的收益。依据Fairfield等人的观点,结合我国2007年前利润表结构和经营性收益所包括的项目可知:OPINC=毛利-经营费用、管理费用、财务费用-主营业务税金及附加+其他业务收入-其他业务支出-存货跌价损失-少数股东收益;其中,毛利-经营费用、管理费用、财务费用-主营业务税金及附加+其他业务收入-其他业务支出-存货跌价损失=营业利润。注意:投资收益不包括在经营性收益中,而包括在非经营性收益中,这与2007年新准则不同。另一个变量NOPTAX,它是非经营性收益NONOPIN和所得税费用INCTAX构成,即NOPTAX=NONOPIN—INCTAX。由于以下两方面的原因:其一,我国2007年利润表中不能直接计算NONPIN,因为我国会计财务报表所说的非经营性利润与美国不同,没有象美国准则那样详细的区分开来;其二,因为我们所有模型的计算口径都是以扣除非经常性损益后的净利润E′为基点,因此,即使可以计算出来NOPTAX,也不能保证OPINC与NOPTAX之和等于扣除非经常性损益后的净利润E′,所以,为了保证计算口径的一致性及计算方便,对于NOPTAX也采用倒挤方法计算。即,NOPTAX=E′—OPINC。同理,对于NOPTAX也要除以所有者权益期末账面价值。Sloan(1996)所提出来的CASHFLOW模型,该模型也涉及两个变量:现金流量CFO,来自于现金流量表中经营活动现金净流量,另一个变量是应计利润ACCRUALS,它是通过将扣除非经常性损益后的净利润减去现金流量CFO倒挤得到。同样,我们分别对CFO和ACCRUALS平减所有者权益期末账面价值。
三、时间序列预测模型的ROE预测能力相关检验
在研究时间序列预测模型的ROE预测能力时,我们按照Fairfield等(1996)和Banker等(2006)的方法采用了行业水平下滚动随机系数回归方法,我们对该方法的原理简要介绍如下。
(一)行业水平下滚动随机系数回归方法
按照Fairfield等(1996)和Banker等(2006)的方法,我们运用基于4年期时间窗口的数据为滚动随机系数回归分析来估计五个时间序列预测模型以及Logit随机系数回归的每子区间的参数值。这种滚动方法的时间窗口与滚动预算方法时间窗口极其相似。运用滚动随机系数回归方法的目的是为了控制预测模型参数的不稳定性。其原理是先对事前规定好的时间窗口所得到的多个子样本观察值进行多次直线回归分析,然后再把所得到的多条回归直线二次拟合成一条直线,二次拟合的直线是由多个子样本观察值回归分析系数集的平均值拟合成的,它们的权益是相同的。我们常常做的回归分析大多数情况下只是将因变量与自变量放在一起做一次回归分析,它只是将数据的点连成一条直线,从而得到回归方程的一组拟合参数。滚动随机系数回归分析方法先通过事前规定的时间窗口将点拟合成直线,然后,在此基础上,再对拟合出来的直线进行二次拟合成最终回归直线。因此,滚动随机系数回归分析方法一般情况下分为二步,首先,以规定好的区间窗口进行多次滚动回归分析,并得到回归分析的多组拟合参数值,而且每一组参数值很可能都不同;然后将多条回归直线所拟合的参数值分别求均值,再将模型变量的各个参数平均值代入模型中就是最终所拟合的回归直线。因此,滚动随机系数回归方法所拟合出来的直线比只做一次回归分析所拟合出来的直线效果更好,从而保证回归方程所得到的拟合系数更稳定。例如,假设我们以4年期为时间窗口进行滚动随机系数回归分析,并假设数据起始年度为2001年,那么4后期滚动随机系数回归就产生以下一些了子样本区间:运用2001-2004年数据来估计预测模型参数并构建一个预测2005年的ROE;运用2002-2005年数据来估计预测模型并得到一组新的参数并构建一个预测2006年的ROE;运用2003-2006年数据来估计预测模型并得到一组新的参数并构建一个预测2007年的ROE,以此类推。在本文中,我们先2001年至2006年数据以4年期为窗口进行了滚动随机系数回归分析。也就是说从2001-2004年数据做一次回归,预测模型2005年的ROE,并得到所有五个时间序列预测模型的一组回归参数;然后我们再用2002-2005年数据做一次回归,预测模型2006年的ROE,并得到所有五个时间序列预测模型的一组新的回归参数。由于我们2007年实施新会计准则,2007年度前后数据口径不一致,所以我们只做到2006年为止。这样从2001年至2005年我们得到了二个相对重叠的4年期时间窗口估计期间。对每个时间序列预测模型来说,行业水平随机系数回归方法产生行业均值的系数估计和每个公司偏离行业均值的方差。这样每个具体公司随机回归系数的估计是由行业均值和具体公司方差之和决定。对预测区间我们运用具体公司估计来计算ROE预测。
(二)样本数据与描述性统计检验
由于我国在2007年采用新会计准则,导致2007年前后上市公司财务数据不具有可比性,所以本文在数据选取时,选取2001-2006年数据为样本观察值;对于滚动时间窗口选取,我们选择4年期滚动时间窗口。我们是经过“试错”实证检验方法最终决定选取2001-2006年度区间和行业水平下4年期时间窗口的滚动随机系数回归,具体地“试错”实证检验见“包括非经常性损益盈余的盈余及其派生财务指标的预测及其信息含量”一文,此处赘述。
为了消除数据误差和异常值对时间序列模型估计及模型预测准确性评价的潜在影响,我们在筛选样本过程中,将样本观察值中期末所有者权益为小于或等于零的、ROE及滞后期ROE的观察值的绝对值大于1的、净利润率大于1的样本,以及被ST和PT上市公司全部剔除。经过以上筛选过程一共收集了含量从2001年到2006年横跨6年预测期的897家上市公司的4110条公司/年度样本。同样,为了进一步保证预测模型稳健性,我们对变量的异常值进行了处理。我们删除了变量ROE、滞后一期ROE、以及OPINC、NOPTAX、CFO、ACCRUALS和SALES所有的样本观察值大于99%和小于1%的数据。其中,ROE数据被删除了82条;滞后一期ROE数据被删除了80条;OPINC数据被删除了76条;NOPTAX数据被删除了74条;CFO数据被删除了74条;ACCRUALS数据被删除了72条;SALSES数据被删除了78条。经过以上处理,我们最终得到853家上市公司3504条公司/年度数据。我们运用Stata10.0统计软件检验。
我们对有关ROE及ROE组成部分的2005年至2006年全样本数据做了一个描述性统计,统计结果如表1所示。
(三)时间序列预测模型的ROE预测能力主要检验
1、行业水平下滚动窗口Logit回归检验
滚动行业水平下4年期时间窗口的销售收入降低的哑变量对滞后销售收入百分比变动方向的行业水平下Logit随机系数回归参数估计,样本估计区间2001-2005。
所研究的利用盈余结构预测未来期间盈余及其派生财务指标ROE等时间序列预测模型中,CVCS模型和修正ROE模型都内含哑变量,其中CVCS模型:ROEt=γd0+γd1DECRDUMt+γd2ROEt-1+γd3SALESt-1+γd4SALESt-1*DECRDUMt+εt,修正ROE模型ROEt=γe0+γe1LOSS+γe2ROEt-1+γe3LOSS*SALESt-1+εt。修正ROE模型中的哑变量不需要做进一步工作就可以比较直观判断。因此,我们对所研究的时间序列模型的哑变量的研究主要是CVCS模型。为了研究CVCS模型预测ROE,除了对参数估计以外,我们还需要对未来一年的销售收入增减变化方向进行预测,也就是说,我们要对未来一年净销售收入相对于当期净销售收入的增减情况进行预测。这个估计量是基于预测期之前的可获得信息基础上进行的。我们运用下面形式的一个Logit回归来估计销售净收入减少指标DECRDUMt。Prob(DECRDUMt=1)=■。y=β0+β1△REVt-1+εt,△REVt-1+εt表示T-2年到T-1年销售净收入的变化百分比。我们运用预测期前四年期为时间窗口的混合样本以滚动行业水平下的随机系数回归方法为基础,估计每个预测年度Logit模型的的参数β0和β1。上表报告了Logit回归的估计结果。跨2个估计期的△REVt-1的估计均值系数是β^1等于.0179714,并且相应的均值胜率估计值等于1.016158。这个结果表明,在T-1期时销售净收入减少百分之一个百分点时,则与T期的销售净收入减少相关胜率的增加为0.984099倍。也就是说,T-1期销售净收入减少则导致在T期同样减少而发生的概率为0.984099。77.35%一致较高的胜率发生率表明,这个简单而且变量极少的Logit模型能够合理地预测未来一期销售净收入的变化方向。
2、时间序列预测模型随机系数回归检验(见表4)
我们运用2个4年期时间窗口的滚动行业水平下的随机系数回归方法得到每个时间序列预测模型的估计系数的均值和标准差。对于ROE模型而言,ROEt-1的平均斜率系数估计为.644509,调整后的平均R2为.2290983。CVCS模型中ROEt-1、SALESt-1、DECRDUMt和SALESt-1*DECRDUMt的平均斜率系数估计分别为.6365415、.0018911、-.0617104和.0270863,调整后的平均R2为.2296326。CVCS模型相对于ROE模型调整后的平均R2更大表明:依据成本性态的方法对盈余进一步分解的CVCS模型可以提高盈余及其派生指标ROE的预测能力。也就是说CVCS模型中ROEt-1、SALESt-1、DECRDUMt和SALESt-1*DECRDUMt不同的斜率系数估计表明盈余的进一步分解为滞后ROE、净销售收入、净销售收入变动方向的哑变量以及净销售收入与净销售收入变动方向的哑变量乘积可以提高ROE的增量预测能力。同理,调整后R2的平均比较方法适用其他两两模型之间。
3、时间序列预测模型的预测误差绝对值相关检验
我们用下式来估计预测期销售净收入减少的哑变量(DECRDUMt≡D^t)的估计值:
DECRDUMt=1,如果β^■+β^■ΔREV■>00,如果β^■+β^■ΔREV■≤0,Prob(DECRDUMt=1)=■,y=β^■+
β^■△REVt-1+εt,△REVt-1表示T-2年到T-1年销售净收入的变化百分比。这个建立在以零为拐角基础上的哑变量分类方案的方程可以解释为一个简单的试探性工作,如果估计的可能性大于50%的话,就可以预测销售净收入是减少的(DECRDUM=1)。因此,CVCS模型对ROE的预测可以用如下公式表示:
ROEt=γ^d0+γ^d1DECRDUMt+γ^d2ROEt-1+γ^d3SALESt-1+γ^d4SALESt-1DECRDUMt
这里的γ^d0,γ^d1,γ^d2,γ^d3,γ^d4是上面CVCS模型的五个估计系数。
ROE模型、OPINC模型、CASHFLOW模型以及修正的ROE模型对ROE的预测分别表示如下:
ROEt=γ^a0+γ^a1ROEt-1{6}
ROEt=γ^b0+γ^b1OPINSCt-1+γ^b2NOPTAXt-1
{7}
ROEt=γ^c0+γ^c1CFOt-1+γ^c2ACCRUALSt-1
{8}
ROEt=γ^d0+γ^d1DECRDUMt+γ^d2ROEt-1
+γ^d3SALESt-1+γ^d4SALESt-1DECRDUMt{9}
ROEt=γ^e0+γ^e1LOSS+γ^e2ROEt-1+
γ^e3LOSS*SALESt-1{10}
上面各模型表达式里的的γ^s都是相应模型的估计参数。
根据以上五个时间序列预测模型的估计参数和销售净收入变化方向的估计,通过以上给定的5个方程中,我们得到预测T期的(ROEt)ROE的五个预测值。预测误差(FE)定义为T期ROE的实际值与预测值ROEt之间的差异。我们用FEt表示:FEt=ROEt-ROEt。误差的绝对值(AFE)是预测误差(FE)的绝对值。我们用AFEt表示:AFEt=|FEt|。
(1)时间序列预测误差绝对值描述性统计
我们在研究五个时间序列预测误差绝对值时,没有剔除五个时间序列预测模型2005-2006年预测误差绝对值的任何观察值,共得到859家上市公司2005-2006年1375个实际值与预测值误差结果,如表5所示。
我们通过研究预测模型预测误差的绝对值的中位数、均值的大小、标准差、四分位数间距,以及不同模型间预测误差的绝对值之差得到的预测能力的改进绝对值和相对值来研究预测模型的预测准确性。但是,我们主要通过研究预测模型预测误差的绝对值的中位数、均值的大小,以及不同模型间预测误差绝对值之差得到的预测能力的改进绝对程度和相对程度来研究预测模型的预测准确性。如果某个时间序列预测模型的预测误差的绝对值的中位数、均值以及四分之一位数和四分之三分位数最大,尤其是预测模型的预测误差的绝对值的中位数和均值最大,而且排序严格一致(即中位数和均值均最大),那么我们就可以认为该预测模型的预测准确性最差;相反,如果某个时间序列预测模型的预测误差的绝对值的中位数、均值以及四分之一位数和四分之三分位数最小,尤其是预测模型的预测误差的绝对值的中位数和均值最小,而且排序严格一致(即中位数和均值均最小),那么我们就认为该预测模型的预测准确性最好。我们为什么通过研究预测误差的绝对值而不直接通过研究预测误差来研究模型预测准确性呢?其一,预测误差的绝对值具有可加性而且不会相互抵消。误差的绝对值不会因预测误差正负直接相加导致相互抵消,保留了预测误差影响,较预测误差更好地衡量模型预测能力;其二,误差绝对值的大小尤其是预测误差绝对值的中位数和均值能够更好地判断预测模型预测ROE值偏离实际ROE程度;其三,可以进一步利用预测误差绝对值大小进行模型间中位数和均值的配对检验;其四,通过计算预测模型预测误差绝对的中位数、均值提高的绝对值和相对值来研究预测模型预测能力改进的绝对程度和相对程度。
对五个时间序列预测模型的误差绝对值的描述性统计如下表。我们发现五个时间序列模型的误差绝对值(AFE)结果中,修正的ROE模型的预测误差绝对值的中位数和均值是最小,分别为.0183839,.0384975;CASHFLOW模型的预测误差绝对值的中位数和均值是最大,分别为.021378,.0418467;ROE模型、CVCS模型,以及OPINC模型的预测误差的绝对值的中位数和均值徘徊在修正的ROE模型和CASHFLOW模型之间,这个结果与包括非常项目的净利润预测结果不同。在我们的描述性统计中,我们还发现,虽然修正的ROE模型预测误差的绝对值的中位数和均值在五个时间序列预测模型中均最小,CASHFLOW模型预测误差的绝对值的中位数和均值在五个时间序列预测模型中均最大,但是,OPINC模型、ROE模型以及CVCS模型的预测误差绝对值的中位数和均值的排序并不始终严格一致。
标准差是统计上用于衡量一组数值中某一数值与其平均值差异程度的指标。标准差被用来评估价格可能的变化或波动程度。简单来说,标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。CASHFLOW模型的预测误差绝对值的标准差为.0605693,表现出来的离差最大;修正的ROE模型的预测误差绝对值的标准差为.0591728,表现出来的离差最小,其他时间序列预测预测模型的标准差界于CASHFLOW模型与修正的ROE模型之间。因此,就标准差这一考察指标而言,除CASHFLOW模型外,其他模型将总括盈余进行分解,均有助于提高预测盈余及其派生指标能力。
通过对五个时间序列预测模型预测误差绝对值的中位数和均值排序,我们发现,从模型预测误差绝对值排序角度来看,运用CASHFLOW模型对盈余的分解没有提高预测ROE的准确性,没有证明将盈余分解为现金流量与应计利润能进一步提高对ROE的准确度。从预测误差的标准差的角度来看,利用CASHFLOW模型对盈余的分解同样不能提高预测ROE的准确性。从描述性统计的整体来看,修正的ROE模型的预测准确度一直最好,CASHFLOW模型的预测准确效果一直最差。
(2)时间序列预测模型间误差绝对值中位数与均值配对检验
为了提供预测提高程度的统计检验,我们还采用了Fairfield等(1996)的方法,我们在没有严格假定各预测模型预测误差绝对值基本分布的确切形式的情况下,运用非参数的符号秩检验来评价模型预测误差绝对值的两两配对差异(Lehmann1975;Sheskin1997)。因此,为了检验模型预测改进是否有统计显著性,我们对预测误差的绝对值的中位数用非参数的Wilcoxon符号秩对模型预测误差绝对值中位数的配对差进行检验,同时,运用均值的配对检验来检验预测误差绝对值的均值配对差的显著性。下表报告了基于预测误差绝对值差异分布上的五个模型中任意两个竞争模型之间的预测误差绝对值配对比较。在每一行中都包括一个比较模型与一个基本模型之间的预测误差绝对值差异的中位数,平均数,标准差。预测误差绝对值差异的正值(负值)表示与基本模型相比,比较模型会得到一个预测误差绝对值水平更低(或更高的),因此,预测未来一期ROE将会得到一个准确率更好(更差)。建立在配对比较上的所有结果与描述性统计中所报告的预测误差绝对值的中位数和均值相一致。CVCS模型相对于ROE模型来说,其预测误差绝对值的中位数减少5.42e-06(P<0.05);CASHFLOW模型相对于ROE模型其预测误差绝对值的中位数增加.0003842(P<0.01)。同理,预测误差绝对值的中位数减少或增加表明了两两模型之间预测准确性强弱程度。
(未完待续)
关键词:非经常性损益;盈余分解;ROE;预测能力;精确性;相关性
在研究净利润结构时,考虑到上市公司利用非经常性项目操纵净盈余。为了实现真实、准确反映上市公司盈利能力,客观评价公司的盈利水平;为进一步规范上市公司信息披露行为,提高上市公司财务信息披露的质量,保护投资者的合法权益;为准确考核上市公司、拟发行上市公司的盈利能力等目的,我国证监会制定了《公开发行证券公司信息披露编报规则第9号—净资产收益率和每股收益的计算及披露》,该规则要求计算扣除非经常性损益后的净利润,但并没有明确界定非经常性损益。由于证券会在相关融资法规及多项信息披露规范中使用了“非经常性损益”的概念,但这些规范未对这个概念的内涵、外延给出清晰的界定,公司对此理解不一,具体执行时往往采用不同的判断标准,导致公司对所披露“扣除非经常性损益的净利润”等财务指标的计算可能不准确,相互间也缺乏可比性。2001年4月25日证监会颁布了《公开发行证券的公司信息披露规范问答第1号—非经常性损益》,对非经常性损益的含义和内容作了较为清晰的界定。但从执行的情况看,无论是其披露还是涉及项目的认定方面均存在差异,出现公司根据自己的需要增加减少非经常性损益项目的现象。为此,证监会明确界定了非经常性损益的含义和内容。该问答指出非经常性损益概念及其包括的内容。为了研究非经常性损益对上市公司持续盈利能力及其派生财务指标的影响,我们借鉴了国内外学者研究扣除非经常性损益后的盈余的研究方法,再次研究了五个时间序列预测模型对扣除非经常性损益后的盈余及其派生财务指标的预测能力及其信息含量。为此,我们不仅研究了包括非常项目的净利润结构预测未来期间的盈余及其派生指标情况,而且还研究了扣除非常项目后的净利润结构预测未来期间的盈余及其派生指标情况。
一、ROE预测能力及其信息含量的时间序列模型
我们通过比较仅以滞后ROE数据为基础预测ROE的基本ROE模型、以滞后的经营性收益和非经营性收益分解为基础预测ROE的OPINC模型、以滞后的现金流量和应计利润组成部分为基础预测ROE的CASHFLOW模型、以滞后ROE及公司盈余是否亏损为哑变量预测ROE的LROE模型以及以成本性态为基础预测ROE的CVCS模型在预测ROE的精确程度来度量各个模型在预测ROE的优劣。我们所考查的这五个时间序列模型如下:
ROE模型:ROEt=γa0+γa1ROEt-1+εt{1}
OPINC模型::ROEt=γb0+γb1OPINCt-1+γb2NOPTAXt-1+εt{2}
CASHFLOW模型:ROEt=γc0+γc1CFOt-1+γc2ACCREALSt-1+εt{3}
CVCS模型:ROEt=γd0+γd1DECRDUMt+γd2ROEt-1+γd3SALESt-1+γd4SALESt-1
*DECRDUMt+εt{4}
LROE模型:ROEt=γe0+γe1LOSS+γe2ROEt-1+γe3LOSS*SALESt-1+εt{5}
模型中,LOSS=1,如果ROE■<00,如果ROE■≥0
我们运用行业水平随机系数回归来估计五个模型并考虑了每个行业模型对公司的随机异质性。对每个公司的系数具有随机差异并对每个行业来说服从均值和方差的独立分布。以方程{4}为例来说明这一点,方程{4}的系数集假定服从下面的随机结构。■,i=0,1,......,n。对方程{1}来说,n=1;对方程{2}来说,n=2;同理,对方程{3}来说,n=2;对方程{4}来说,n=4;对方程{5}来说,n=3。在这里,■是某一特定公司所处行业的均值,它是一个常数。■服从N(0,σ2IND),是指特定公司偏离行业均值的误差。每一个■服从一个均值为0和该公司所处行业方差为σ2IND的正态分布。我们运用混合样本,在任何时期T里,对每个公司都存在没有解释ROE的方差εt。运用随机系数回归方法估计这些系数时,相似随机结构的影响也存在其他几个时间序列模型中。这样做的目的是为了在可比的基础上评价时间序列模型的预测能力及其信息含量。
按照Fairfield等(1996)和Banker等(2006)的方法,用数学方法来说明随机系数回归的系数估计集合时,可以用以下方程表示:γ^di=γ^■+δ^■,i=0,1,...,4。γ^■表示估计的行业均值,δ^■表示每个单独公司偏离行业均值的估计方差。
二、文献回顾与变量定义
(一)文献回顾
本文文献回顾请参考我们于2008年10期发表《财会月刊》(理论版)《ROE预测能力及信息含量研究:回顾与展望》一文,此文不再赘述。
(二)变量定义
我国证券会规定:公司在计算“扣除非经常性损益后的净利润”、“扣除非经常性损益后的净资产收益率”等财务指标时,应扣除非经常性损益的所得税影响数。但是,我们在研究非经常性损益时,由于不能确切地知道每个上市公司所得税税率,因此,我们没有考虑非经常性损益对所得税的影响,而是直接将净利润扣除非经常性损益视为扣除非经常性损益后的净利润,这种处理会导致我们的扣除非经常性损益后的净利润数据与实际应有数据有一定差异。但是,这种非经常性损益对所得税影响的差异不会影响最终结论。
我们定义ROE为扣除非经常性损益后的净利润除以股东权益平均余额;当分母未公布或为零或小于零时,以零表示;股东权益平均余额=股东权益期末余额。SALSES为净销售收入除以所有者权益的期末账面价值;OPINC为经营性收益除以所有者权益的期末账面价值。根据Fairfield(1996)所提出来OPINC模型,该模型涉及两个变量,经营性收益OPINC,它是通过利润表计算得到。Fairfield(1996)将OPINC定义为包括毛利、销售费、一般性的管理费、折旧费、利息费和少数股东的收益。依据Fairfield等人的观点,结合我国2007年前利润表结构和经营性收益所包括的项目可知:OPINC=毛利-经营费用、管理费用、财务费用-主营业务税金及附加+其他业务收入-其他业务支出-存货跌价损失-少数股东收益;其中,毛利-经营费用、管理费用、财务费用-主营业务税金及附加+其他业务收入-其他业务支出-存货跌价损失=营业利润。注意:投资收益不包括在经营性收益中,而包括在非经营性收益中,这与2007年新准则不同。另一个变量NOPTAX,它是非经营性收益NONOPIN和所得税费用INCTAX构成,即NOPTAX=NONOPIN—INCTAX。由于以下两方面的原因:其一,我国2007年利润表中不能直接计算NONPIN,因为我国会计财务报表所说的非经营性利润与美国不同,没有象美国准则那样详细的区分开来;其二,因为我们所有模型的计算口径都是以扣除非经常性损益后的净利润E′为基点,因此,即使可以计算出来NOPTAX,也不能保证OPINC与NOPTAX之和等于扣除非经常性损益后的净利润E′,所以,为了保证计算口径的一致性及计算方便,对于NOPTAX也采用倒挤方法计算。即,NOPTAX=E′—OPINC。同理,对于NOPTAX也要除以所有者权益期末账面价值。Sloan(1996)所提出来的CASHFLOW模型,该模型也涉及两个变量:现金流量CFO,来自于现金流量表中经营活动现金净流量,另一个变量是应计利润ACCRUALS,它是通过将扣除非经常性损益后的净利润减去现金流量CFO倒挤得到。同样,我们分别对CFO和ACCRUALS平减所有者权益期末账面价值。
三、时间序列预测模型的ROE预测能力相关检验
在研究时间序列预测模型的ROE预测能力时,我们按照Fairfield等(1996)和Banker等(2006)的方法采用了行业水平下滚动随机系数回归方法,我们对该方法的原理简要介绍如下。
(一)行业水平下滚动随机系数回归方法
按照Fairfield等(1996)和Banker等(2006)的方法,我们运用基于4年期时间窗口的数据为滚动随机系数回归分析来估计五个时间序列预测模型以及Logit随机系数回归的每子区间的参数值。这种滚动方法的时间窗口与滚动预算方法时间窗口极其相似。运用滚动随机系数回归方法的目的是为了控制预测模型参数的不稳定性。其原理是先对事前规定好的时间窗口所得到的多个子样本观察值进行多次直线回归分析,然后再把所得到的多条回归直线二次拟合成一条直线,二次拟合的直线是由多个子样本观察值回归分析系数集的平均值拟合成的,它们的权益是相同的。我们常常做的回归分析大多数情况下只是将因变量与自变量放在一起做一次回归分析,它只是将数据的点连成一条直线,从而得到回归方程的一组拟合参数。滚动随机系数回归分析方法先通过事前规定的时间窗口将点拟合成直线,然后,在此基础上,再对拟合出来的直线进行二次拟合成最终回归直线。因此,滚动随机系数回归分析方法一般情况下分为二步,首先,以规定好的区间窗口进行多次滚动回归分析,并得到回归分析的多组拟合参数值,而且每一组参数值很可能都不同;然后将多条回归直线所拟合的参数值分别求均值,再将模型变量的各个参数平均值代入模型中就是最终所拟合的回归直线。因此,滚动随机系数回归方法所拟合出来的直线比只做一次回归分析所拟合出来的直线效果更好,从而保证回归方程所得到的拟合系数更稳定。例如,假设我们以4年期为时间窗口进行滚动随机系数回归分析,并假设数据起始年度为2001年,那么4后期滚动随机系数回归就产生以下一些了子样本区间:运用2001-2004年数据来估计预测模型参数并构建一个预测2005年的ROE;运用2002-2005年数据来估计预测模型并得到一组新的参数并构建一个预测2006年的ROE;运用2003-2006年数据来估计预测模型并得到一组新的参数并构建一个预测2007年的ROE,以此类推。在本文中,我们先2001年至2006年数据以4年期为窗口进行了滚动随机系数回归分析。也就是说从2001-2004年数据做一次回归,预测模型2005年的ROE,并得到所有五个时间序列预测模型的一组回归参数;然后我们再用2002-2005年数据做一次回归,预测模型2006年的ROE,并得到所有五个时间序列预测模型的一组新的回归参数。由于我们2007年实施新会计准则,2007年度前后数据口径不一致,所以我们只做到2006年为止。这样从2001年至2005年我们得到了二个相对重叠的4年期时间窗口估计期间。对每个时间序列预测模型来说,行业水平随机系数回归方法产生行业均值的系数估计和每个公司偏离行业均值的方差。这样每个具体公司随机回归系数的估计是由行业均值和具体公司方差之和决定。对预测区间我们运用具体公司估计来计算ROE预测。
(二)样本数据与描述性统计检验
由于我国在2007年采用新会计准则,导致2007年前后上市公司财务数据不具有可比性,所以本文在数据选取时,选取2001-2006年数据为样本观察值;对于滚动时间窗口选取,我们选择4年期滚动时间窗口。我们是经过“试错”实证检验方法最终决定选取2001-2006年度区间和行业水平下4年期时间窗口的滚动随机系数回归,具体地“试错”实证检验见“包括非经常性损益盈余的盈余及其派生财务指标的预测及其信息含量”一文,此处赘述。
为了消除数据误差和异常值对时间序列模型估计及模型预测准确性评价的潜在影响,我们在筛选样本过程中,将样本观察值中期末所有者权益为小于或等于零的、ROE及滞后期ROE的观察值的绝对值大于1的、净利润率大于1的样本,以及被ST和PT上市公司全部剔除。经过以上筛选过程一共收集了含量从2001年到2006年横跨6年预测期的897家上市公司的4110条公司/年度样本。同样,为了进一步保证预测模型稳健性,我们对变量的异常值进行了处理。我们删除了变量ROE、滞后一期ROE、以及OPINC、NOPTAX、CFO、ACCRUALS和SALES所有的样本观察值大于99%和小于1%的数据。其中,ROE数据被删除了82条;滞后一期ROE数据被删除了80条;OPINC数据被删除了76条;NOPTAX数据被删除了74条;CFO数据被删除了74条;ACCRUALS数据被删除了72条;SALSES数据被删除了78条。经过以上处理,我们最终得到853家上市公司3504条公司/年度数据。我们运用Stata10.0统计软件检验。
我们对有关ROE及ROE组成部分的2005年至2006年全样本数据做了一个描述性统计,统计结果如表1所示。
(三)时间序列预测模型的ROE预测能力主要检验
1、行业水平下滚动窗口Logit回归检验
滚动行业水平下4年期时间窗口的销售收入降低的哑变量对滞后销售收入百分比变动方向的行业水平下Logit随机系数回归参数估计,样本估计区间2001-2005。
所研究的利用盈余结构预测未来期间盈余及其派生财务指标ROE等时间序列预测模型中,CVCS模型和修正ROE模型都内含哑变量,其中CVCS模型:ROEt=γd0+γd1DECRDUMt+γd2ROEt-1+γd3SALESt-1+γd4SALESt-1*DECRDUMt+εt,修正ROE模型ROEt=γe0+γe1LOSS+γe2ROEt-1+γe3LOSS*SALESt-1+εt。修正ROE模型中的哑变量不需要做进一步工作就可以比较直观判断。因此,我们对所研究的时间序列模型的哑变量的研究主要是CVCS模型。为了研究CVCS模型预测ROE,除了对参数估计以外,我们还需要对未来一年的销售收入增减变化方向进行预测,也就是说,我们要对未来一年净销售收入相对于当期净销售收入的增减情况进行预测。这个估计量是基于预测期之前的可获得信息基础上进行的。我们运用下面形式的一个Logit回归来估计销售净收入减少指标DECRDUMt。Prob(DECRDUMt=1)=■。y=β0+β1△REVt-1+εt,△REVt-1+εt表示T-2年到T-1年销售净收入的变化百分比。我们运用预测期前四年期为时间窗口的混合样本以滚动行业水平下的随机系数回归方法为基础,估计每个预测年度Logit模型的的参数β0和β1。上表报告了Logit回归的估计结果。跨2个估计期的△REVt-1的估计均值系数是β^1等于.0179714,并且相应的均值胜率估计值等于1.016158。这个结果表明,在T-1期时销售净收入减少百分之一个百分点时,则与T期的销售净收入减少相关胜率的增加为0.984099倍。也就是说,T-1期销售净收入减少则导致在T期同样减少而发生的概率为0.984099。77.35%一致较高的胜率发生率表明,这个简单而且变量极少的Logit模型能够合理地预测未来一期销售净收入的变化方向。
2、时间序列预测模型随机系数回归检验(见表4)
我们运用2个4年期时间窗口的滚动行业水平下的随机系数回归方法得到每个时间序列预测模型的估计系数的均值和标准差。对于ROE模型而言,ROEt-1的平均斜率系数估计为.644509,调整后的平均R2为.2290983。CVCS模型中ROEt-1、SALESt-1、DECRDUMt和SALESt-1*DECRDUMt的平均斜率系数估计分别为.6365415、.0018911、-.0617104和.0270863,调整后的平均R2为.2296326。CVCS模型相对于ROE模型调整后的平均R2更大表明:依据成本性态的方法对盈余进一步分解的CVCS模型可以提高盈余及其派生指标ROE的预测能力。也就是说CVCS模型中ROEt-1、SALESt-1、DECRDUMt和SALESt-1*DECRDUMt不同的斜率系数估计表明盈余的进一步分解为滞后ROE、净销售收入、净销售收入变动方向的哑变量以及净销售收入与净销售收入变动方向的哑变量乘积可以提高ROE的增量预测能力。同理,调整后R2的平均比较方法适用其他两两模型之间。
3、时间序列预测模型的预测误差绝对值相关检验
我们用下式来估计预测期销售净收入减少的哑变量(DECRDUMt≡D^t)的估计值:
DECRDUMt=1,如果β^■+β^■ΔREV■>00,如果β^■+β^■ΔREV■≤0,Prob(DECRDUMt=1)=■,y=β^■+
β^■△REVt-1+εt,△REVt-1表示T-2年到T-1年销售净收入的变化百分比。这个建立在以零为拐角基础上的哑变量分类方案的方程可以解释为一个简单的试探性工作,如果估计的可能性大于50%的话,就可以预测销售净收入是减少的(DECRDUM=1)。因此,CVCS模型对ROE的预测可以用如下公式表示:
ROEt=γ^d0+γ^d1DECRDUMt+γ^d2ROEt-1+γ^d3SALESt-1+γ^d4SALESt-1DECRDUMt
这里的γ^d0,γ^d1,γ^d2,γ^d3,γ^d4是上面CVCS模型的五个估计系数。
ROE模型、OPINC模型、CASHFLOW模型以及修正的ROE模型对ROE的预测分别表示如下:
ROEt=γ^a0+γ^a1ROEt-1{6}
ROEt=γ^b0+γ^b1OPINSCt-1+γ^b2NOPTAXt-1
{7}
ROEt=γ^c0+γ^c1CFOt-1+γ^c2ACCRUALSt-1
{8}
ROEt=γ^d0+γ^d1DECRDUMt+γ^d2ROEt-1
+γ^d3SALESt-1+γ^d4SALESt-1DECRDUMt{9}
ROEt=γ^e0+γ^e1LOSS+γ^e2ROEt-1+
γ^e3LOSS*SALESt-1{10}
上面各模型表达式里的的γ^s都是相应模型的估计参数。
根据以上五个时间序列预测模型的估计参数和销售净收入变化方向的估计,通过以上给定的5个方程中,我们得到预测T期的(ROEt)ROE的五个预测值。预测误差(FE)定义为T期ROE的实际值与预测值ROEt之间的差异。我们用FEt表示:FEt=ROEt-ROEt。误差的绝对值(AFE)是预测误差(FE)的绝对值。我们用AFEt表示:AFEt=|FEt|。
(1)时间序列预测误差绝对值描述性统计
我们在研究五个时间序列预测误差绝对值时,没有剔除五个时间序列预测模型2005-2006年预测误差绝对值的任何观察值,共得到859家上市公司2005-2006年1375个实际值与预测值误差结果,如表5所示。
我们通过研究预测模型预测误差的绝对值的中位数、均值的大小、标准差、四分位数间距,以及不同模型间预测误差的绝对值之差得到的预测能力的改进绝对值和相对值来研究预测模型的预测准确性。但是,我们主要通过研究预测模型预测误差的绝对值的中位数、均值的大小,以及不同模型间预测误差绝对值之差得到的预测能力的改进绝对程度和相对程度来研究预测模型的预测准确性。如果某个时间序列预测模型的预测误差的绝对值的中位数、均值以及四分之一位数和四分之三分位数最大,尤其是预测模型的预测误差的绝对值的中位数和均值最大,而且排序严格一致(即中位数和均值均最大),那么我们就可以认为该预测模型的预测准确性最差;相反,如果某个时间序列预测模型的预测误差的绝对值的中位数、均值以及四分之一位数和四分之三分位数最小,尤其是预测模型的预测误差的绝对值的中位数和均值最小,而且排序严格一致(即中位数和均值均最小),那么我们就认为该预测模型的预测准确性最好。我们为什么通过研究预测误差的绝对值而不直接通过研究预测误差来研究模型预测准确性呢?其一,预测误差的绝对值具有可加性而且不会相互抵消。误差的绝对值不会因预测误差正负直接相加导致相互抵消,保留了预测误差影响,较预测误差更好地衡量模型预测能力;其二,误差绝对值的大小尤其是预测误差绝对值的中位数和均值能够更好地判断预测模型预测ROE值偏离实际ROE程度;其三,可以进一步利用预测误差绝对值大小进行模型间中位数和均值的配对检验;其四,通过计算预测模型预测误差绝对的中位数、均值提高的绝对值和相对值来研究预测模型预测能力改进的绝对程度和相对程度。
对五个时间序列预测模型的误差绝对值的描述性统计如下表。我们发现五个时间序列模型的误差绝对值(AFE)结果中,修正的ROE模型的预测误差绝对值的中位数和均值是最小,分别为.0183839,.0384975;CASHFLOW模型的预测误差绝对值的中位数和均值是最大,分别为.021378,.0418467;ROE模型、CVCS模型,以及OPINC模型的预测误差的绝对值的中位数和均值徘徊在修正的ROE模型和CASHFLOW模型之间,这个结果与包括非常项目的净利润预测结果不同。在我们的描述性统计中,我们还发现,虽然修正的ROE模型预测误差的绝对值的中位数和均值在五个时间序列预测模型中均最小,CASHFLOW模型预测误差的绝对值的中位数和均值在五个时间序列预测模型中均最大,但是,OPINC模型、ROE模型以及CVCS模型的预测误差绝对值的中位数和均值的排序并不始终严格一致。
标准差是统计上用于衡量一组数值中某一数值与其平均值差异程度的指标。标准差被用来评估价格可能的变化或波动程度。简单来说,标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。CASHFLOW模型的预测误差绝对值的标准差为.0605693,表现出来的离差最大;修正的ROE模型的预测误差绝对值的标准差为.0591728,表现出来的离差最小,其他时间序列预测预测模型的标准差界于CASHFLOW模型与修正的ROE模型之间。因此,就标准差这一考察指标而言,除CASHFLOW模型外,其他模型将总括盈余进行分解,均有助于提高预测盈余及其派生指标能力。
通过对五个时间序列预测模型预测误差绝对值的中位数和均值排序,我们发现,从模型预测误差绝对值排序角度来看,运用CASHFLOW模型对盈余的分解没有提高预测ROE的准确性,没有证明将盈余分解为现金流量与应计利润能进一步提高对ROE的准确度。从预测误差的标准差的角度来看,利用CASHFLOW模型对盈余的分解同样不能提高预测ROE的准确性。从描述性统计的整体来看,修正的ROE模型的预测准确度一直最好,CASHFLOW模型的预测准确效果一直最差。
(2)时间序列预测模型间误差绝对值中位数与均值配对检验
为了提供预测提高程度的统计检验,我们还采用了Fairfield等(1996)的方法,我们在没有严格假定各预测模型预测误差绝对值基本分布的确切形式的情况下,运用非参数的符号秩检验来评价模型预测误差绝对值的两两配对差异(Lehmann1975;Sheskin1997)。因此,为了检验模型预测改进是否有统计显著性,我们对预测误差的绝对值的中位数用非参数的Wilcoxon符号秩对模型预测误差绝对值中位数的配对差进行检验,同时,运用均值的配对检验来检验预测误差绝对值的均值配对差的显著性。下表报告了基于预测误差绝对值差异分布上的五个模型中任意两个竞争模型之间的预测误差绝对值配对比较。在每一行中都包括一个比较模型与一个基本模型之间的预测误差绝对值差异的中位数,平均数,标准差。预测误差绝对值差异的正值(负值)表示与基本模型相比,比较模型会得到一个预测误差绝对值水平更低(或更高的),因此,预测未来一期ROE将会得到一个准确率更好(更差)。建立在配对比较上的所有结果与描述性统计中所报告的预测误差绝对值的中位数和均值相一致。CVCS模型相对于ROE模型来说,其预测误差绝对值的中位数减少5.42e-06(P<0.05);CASHFLOW模型相对于ROE模型其预测误差绝对值的中位数增加.0003842(P<0.01)。同理,预测误差绝对值的中位数减少或增加表明了两两模型之间预测准确性强弱程度。
(未完待续)