1. 中国知网期刊下载 股票投资价值理论文献综述--《财会通讯》2012年06期,最好是word版本的。
股票投资价值理论文献综述周淼(河南省财政科研所河南郑州450008)摘要:2010年国务院原则同意开展证券公司融资融券业务试点和推出股指期货品种,这将为证券市场注入新的活力,也是我国资本市场逐步走向成熟的体现。本文回顾有关股票投资价值的研究综述。关键词:股票投资价值文献作者简介:周淼(1979-),女,河南固始人,河南省财政科研所助理研究员一、引言在我国的证券市场中,有股票、债券和证券投资基金等投资品种。其中,股票作为资本市场的一部分,占据着证券市场的主要地位,股票市场也被形象的称为“国民经济的晴雨表”。它是一种有价证券,通过股份有限公司公开发行的用以证明投资者的股东身份和权益,并据以获得股息和红利的凭证。据考证人类最早的股票投资交易活动,可以追溯到古希腊时期。股票交易活动采取较为有组织的规范化形式,则可以追溯到中世纪时期。而现代的股票交易活动,则以1792年纽约股票证券交易所成立为标志。世界股票市场经过萌芽、发展,逐渐走向繁荣,股票逐渐被投资者们所熟悉并且受到了广泛的欢迎。目前,股票市场在全世界的大部分国家和地区已经成为金融市场中不可或缺的重要组成部分,为这些国家和地区金融市场的繁荣和企业竞争力的提升起到了积极和关键的推动作用。从1980年抚顺红砖第一次发行股票算起,改革开放以后当代中国的股票市场已经有了近26年的历史,这段历史可以划分为三个阶段。一是1980年至1991年的起步和复兴阶段。从第一张真正意义上的股票问世,截至1990年12月上交所开业之时,上海只有延中实业、爱使电子、真空电子、飞乐股份、豫园商场、申华股份、浙江凤凰八家公司发行了股票,这就是所谓的上海老八股。深圳证券交易所1991年7月开业时,有5只股票上市交易,它们分别是深发展、深万科、深金田、深安达、深原野,后来被称为深市老五股。二是1992年至1999年的扩容和成长阶段。1992年初,邓小平南巡讲话从思想上排除了我国股票市场发展的障碍。股票市场的功能得到越来越多人的认同,大量国企纷纷改制上市,上市公司数量迅速增加,股票市场在国民经济中的地位不断提升,对国民经济的影响力、辐射力、推动力在不断加大。三是2000年至今的规范和发展阶段。2000年之后的我国股市进入了深入发展,制度不断完善、规范时期。制度改革,使市场日趋规范化是这一阶段的显著特点。2000年3月16日,中国证监会发布《中国证监会股票发行核准程序》及《股票发行上市辅导工作暂行办法》、《信誉主承销商考评试行办法》、2001年10月16日《首次公开发行股票辅导工作办法》、2004年12月7日《关于首次公开发行股票试行询价制度若干问题的通知》等配套规章,由此拉开了股票发行制度由审批制向核准制的转变。经过近二十年的发展,证券市场的构成已经比较完备,但各参与主体在制度上仍然存在较大缺陷,成为股票市场进一步发展有待解决的问题。二、股票投资价值理论研究意义(一)有利于股东及潜在的投资者制定正确的投资决策就长期持有而言,股票投资可获得相当的股利收入,而短线操作也可能给投资者带来一定的收益,因为从股价的波动可获得比股利更高的差价收入,因而股票投资已越来越成为一般大众所乐于选择的投资工具。我国股市尚处于初创阶段,它还有很多不完善,不规范之处,国家为了使其健康、规范地发展而采取一些人为的干预措施是不可避免的,这就使得我国股市在一段时期内受国家政策的影响比较大。但从发达国家的证券市场的状况分析,在一个规范完善的证券市场中,投资者据以入市的依据是上市公司财务状况、经营业绩及发展潜力等。财务状况与经营业绩好的上市公司的股票即所谓的绩优股倍受投资人的青睐,而绩优股也更能经受住股市振荡的考验。那么,针对上市公司的业绩前景、财务结构、盈利能力等进行的综合评价研究可为更多的投资者做出正确、合理投资决策,最大限度地规避风险,提高投资报酬率。(二)有利于公司加强内部管理上市公司的信息披露制度要求公司的财务状况、经营业绩必须公开,使得企业的发展置于社会和广大股东的关注和监督之下,依据公开的信息进行分析,就可以全面、系统地了解整个公司的生产经营情况,及时发现经营活动中存在的问题,迅速做出决策,采取有效措施,改善生产经营管理,同时也可利用分析结果,为未来的经营计划和经营方针提供决策的依据,不断增长业绩,以期给投资者一个满意回报。(三)有利于政府及监管部门对其进行评价、指导或监督判断上市公司是否具有投资价值的途径,是分析评价上市公司的综合发展力,通过分析评价上市公司与非上市公司、一般企业的差别,从而评判上市公司的运营是否优于非上市公司,并从中凸显股份制改造的作用。证监会、证券交易所等可根据公司营运情况、经营业绩等判断公司的各项经营是否合法,资金使用是否得当等。(四)有利于促进整个资本市场的健康发展目前越来越多的投资者开始重视理性投资,对上市公司的分析已成为证券公司和很多投资者的基础工作之一。但对上市公司的分析中存在着良莠不分,参差不齐的现状,一些利用片面分析人为操作、扰乱市场的情况还时有发生。这些现象严重侵害了广大投资者利益,不利于证券市场的健康发展。提出实行上市公司投资价值评价体系,为客观、全面、科学分析上市公司,满足了广大投资者愿望,符合证券市场发展潮流,促进证券市场健康发展起着积极的作用。周淼:股票投资价值理论文献综述148·综合2012年第2期(下)三、股票投资价值理论研究综述(一)国外研究及现状西方最初对股票理论价格的研究主要是应证券市场投资者的投资需求而进行的。所以在西方的一些论著当中常将此称之为股票投资价值或价值,以示与股票的市场价格相区别。投资价值的提出是在20世纪初,普拉特(Prat,S.S.)是最早提出股票的价格与价值相分离的人。他在1903年出版的《华尔街动态》(TheWorkofWallStreet,1903)中,提出股票价值的经济涉及企业的收益能力,其中以股息为最直接,其它的因素则属于借助股息来影响股票价值的间接因素。普拉特认为,从理论上讲股票的价值与价格是一致的,但在实际上两者的差额颇大。但他认为这种现象并不限于股票,其他商品也有这种情形,只是股票方面比较特殊而已。就价格的形成而言,是由供需因素决定的,所以难与同其真实的价值完全吻合。霍布内(Huebner,S.S.)将普拉特的观点加以补充,他通过对股票价格与价值关系的研究,为投资提供决策的依据。而且,借助对股票发行公司的财务分析来把握股票价值。他认为,“股票价格倾向于与它本质的价值上的一致性”,就长期股票的股价变动因素而言,与其价值有关的即为长期预期收益与资本还原率。多纳(Donner,O)在其《证券市场与景气波动原理》(DieKursbilnganAktienmarket,1934)中认为,股票价格是由市场供求关系决定的,而股票价值取决于企业的收益。认为“企业收益的变动,才是形成股价波动的真正精髓”。虽然实际的股价波动趋势与企业收益趋势有所差异,但就长期而论,股价波动是依存与企业收益和利率,即围绕股票价值而变动。格雷厄姆和多德(Graham,B,andDodd,D,L,1934)在股票理论方面比前者的认识又前进了一步。他们在《证券分析》一书中,对内在价值理论进行了全面阐述。他们认为,股票的内在价值决定于公司未来盈利能力,而且分析企业未来的获利能力,并不仅限于对企业财务分析,同时还需要以观察经济方面未来的趋势作为推测的基础,并考虑适当的资本还原。股票价格会回归到其内在价值上,所以证券分析家要做的工作就是仔细地研究有关发行人的财务数据及其他资料,努力去发现该股票的内在价值,并以此作为判断股票定价的合理性及投资决策的重要指标。其公式为:V=M(D+E/3)±资产价值的修正值(1)上式中V:普通股票价值;M:资本还原倍数;D:预期股息;E:预期收益。式中,M随着企业的发展,股息的增减变动而变化;收益E除以3表示依当时一般上市公司章程之规定大致上是将收益的三分之二作为股息发放出去,而剩余三分之一则作为保留盈余,充实企业发展基金。威廉姆斯(Williams,J.B)在他的《投资价值学说》(TheTheoryofInvestmentValue,1938)一书中首先提出了普通股的一般估价方法,其基本思想是“股票是一种收益凭证,其未来所产生的各期收益的现值之和就是股票的价值,股票价格应该根据其价值来确定。”他认为企业保留盈余完全不必反应在股票价值上,他提出“股票的投资价值是将来今后能领取的全部股息加以资本还原的现在价值的总和”。企业保留的盈余是增加企业以后的收益,迟早也会变成股息发放出去。威廉姆斯提出,买进股票意味着“现在财富与未来财富的交换”,而所谓的未来财富就是今后中期的“股息”,将其进行资本还原即为现在的股票的投资价。威廉姆斯提出的计算公式分为四种情况:(1)股息渐减:V0=ni=1ΣDtVt(2)Vo:普通股的现在投资价值;Dt:t年的股息;Vt:资本还原率;n:领取股息的年数。(2)预期股息稳定:V0=ni=1ΣDtVt=Di(3)(3)预期股息渐增,并打算永远持有:V0=ni=1ΣDtVt=ni=1ΣD0UiVi=∞i=1ΣWi(4)。式中,U=l+g,g为股息年增长率。(4)企业不讲求股息政策,在景气繁荣的年度,股息突增,几年以后增长率又渐减:V0=ni=1ΣDtVt=ni=1ΣDiVi+∞i=n+1ΣDiVi(5)威廉姆斯对投资价值方面的贡献在于他以未来各期股息为主线用数学模型勾划了投资价值的轮廓,开创了用数学模型系数表达股票投资价值的先河。此后西方经济学界中有关投资价值方面的研究基本上都是以这一理论为指导并且没有超过上述的范围。(二)国内研究及现状国内理论界关于股票投资价值的研究还处于起步阶段,近年已经开始引进西方的投资价值理论和分析工具,并且结合我国的实际情况进行了研究。研究的内容涉及期权、资产定价、市场有效性、现金流量、经营业绩等很多方面。(1)以现金流量为基础的价值分析。张先治(2000)介绍了以现金流量为基础的价值评估的意义和方式,价值评估的程序与方法,并初步给出了评估中的参数:现金流量、折现率、评估期的确定方法。颜志刚(2001)对企业价值评估中自由现金流量进行了分析,认为企业价值主要取决于未来的自由现金流量(freecashflow),而自由现金流量是企业经营产生的现金流量,并将自由现金流量表示为:FCF=NI×(1-T)+D-CE-△WC=EBIT×(1-T)+D-CE-△WC(6)EBIT:企业息税前利润;NI:企业挣利润;I:利息;T:所得税率;D:资本增加额;CE:资本支出;△WC:运营资金需求量。曹中等(2001)在2001年,对比了经济利润和现金流量折现模型在企业价值评估中的不同,并给出了利用折现经济利润进行企业价值评估的模型。董直庆、赵振全(2004)利用M-M模型对公司价值评估进行了实证分析,重点论述了考虑破产风险的情况下,对M-M模型进行了修正,增加了破产风险成本参数,探讨了存在破产风险的情况下,企业价值评估模型的改进方法。张根明、王爱武(2001)论述了高科技企业价值评估方法的选择等。149(2)期权定价理论研究。许民利、张子刚(2000)等提出了利用增长期权进行企业价值评估的设想,赵国忻(2000)研究了R&D投资的期权创造和期权享有过程价值,李焰(2003)认为企业价值应该分解为零增长价值和增长机会价值,并提出了用期权定价模型确定企业的增长价值,杜彦鹏、陈迅(2001)利用经营期权评估方法对企业整体价值的评估进行了应用为现金流量处于困境的企业价值评估提供了新思路。上述研究基本是利用Black与Scholes提出的期权定价模型(即optionpricingmodel),对企业价值评估理论进行的补充。国内关于期权定价模型的探讨,往往是将某一企业的数据进行整理后,利用Black与Scholes期权定价模型评估该企业价值。并没有归纳出该模型在我国企业价值评估活动中应用的难点,对于有关参数的选取问题没有提出解决措施,如标的资产的现行价格、期权执行价格、回报率的标准差、累计概率分布等参数根本没有涉及,只是利用某企业数据进行计算,得出企业价值,对于评估价值的可行性和符合性也没有进行检验。(3)证券市场有效性研究。俞乔(2004)、宋颂兴和金伟根(2000)、吴世农(2000)、范龙振、张子刚(2002)。他们运用不同的统计方法,采用不同的样本阶段对我国证券市场是否具有弱式有效进行了统计检验,得出不同的结论。俞乔(2004)选择上海证券交易所交易日2000年月12月19日至2004年4月28日的845个交易日为样本期间,分析了上海证券交易日收盘上证券综合指数的变动情况,经验验证了上海股市非有效性。宋颂兴、金伟根(2000)实证检验了从1998年年底到2000年上海股市股份的正态分布规律和随机行走特征,验证了上海股市那个阶段的弱式有效市场假说。同时指出,股市规模的扩大、政策法律的完善和信息正确快速的传播,是我国股市发展的趋势,也是股市有效的基础。吴世农(2000)在阐述证券市场效率理论和研究方法的基础上,结合国内外的实证研究结果,对如何认识我国证券市场的效率提出了他的看法:我国股市仍然外于初期发展阶段,信息的完整性、分布的均匀性和实效性与发达国家存在较大差距,某段时期股份的随机游走特征尚不能完全确定股市达到弱式有效。范龙振,张子刚(2002)指出利用自相关系数进行检验的不合理性,取而代之,他们用DF检验,利用2001年7月至10月4个月的每日股票收盘价检验了5种上市公司的股票,得出了股票市场弱式有效的结论。沈艺峰、吴世农(2000)还对我国证券市场是否过度反映进行了研究。孙命(2004)从有效资本市场中出现关系于EMH的例子进行分析,提出对策。杨兵等(2002)随机选取沪、深两市各25家上市公司的日收盘价的收益率序列呈现显著的尖峰厚尾及非正态性分布,并呈现出很高的序列相关性。由此得出沪、深两市还未达到弱式有效的结论。(4)经营业绩研究。许彪、梁宇鹏(2000)运用因子分析方法和概率统计分析方法对农业类上市公司五方面的能力指标利用传统财务指标体系进行了考察,将1996年至1999年四年的36家农业类上市公司的经营业绩分为好、一般、差三类,认为改善整个农业上市公司经营绩效和增强企业财务风险抵御能力的关键是调整营运能力和偿债能力方面指标;对于经营绩效好或较好的农业上市公司,经营绩效提升的策略重点应该放在提高营运能力方面;对于经营绩效一般的农业上市公司,经营绩效提升的策略重点应该放在大幅度提高偿债能力方面和营运能力方面;对于综合绩效差的农业上市公司,经营绩效的提升应该是全方位的。郝清民等(2003)用因子分析法来评价煤炭上市公司的经营业绩,得出不同公司的相对竞争优势所在,为不同的利益相关者做出决策提供了参考。刘秀芹(2004)利用因子分析法分析电子行业上市公司的绩效状况,使投资者清楚地看到上市公司的经营业绩和投资价值,为上市公司决策者提供了重要的决策依据。朱丽莉、王怀明(2004)利用因子分析对农业类上市公司进行评价,提取了反映农业上市公司经营绩效的公共因子,根据公共因子的贡献率及因子值对农业上市公司的经营绩效进行综合分析,得出46家农业上市公司排名,较好地评价了农业上市公司经营绩效,为相关的判断提供了参考。参考文献:[1]赵国忻:《R&D投资的期权创造和期权享有过程价值研究》,《科学管理》2000年第3期。[2]董直庆、赵振全:《股票价格与价值的测度及特性分析———基于流动性的新解释》,《
股票投资价值理论文献综述周淼(河南省财政科研所河南郑州450008)摘要:2010年国务院原则同意开展证券公司融资融券业务试点和推出股指期货品种,这将为证券市场注入新的活力,也是我国资本市场逐步走向成熟的体现。本文回顾有关股票投资价值的研究综述。关键词:股票投资价值文献作者简介:周淼(1979-),女,河南固始人,河南省财政科研所助理研究员一、引言在我国的证券市场中,有股票、债券和证券投资基金等投资品种。其中,股票作为资本市场的一部分,占据着证券市场的主要地位,股票市场也被形象的称为“国民经济的晴雨表”。它是一种有价证券,通过股份有限公司公开发行的用以证明投资者的股东身份和权益,并据以获得股息和红利的凭证。据考证人类最早的股票投资交易活动,可以追溯到古希腊时期。股票交易活动采取较为有组织的规范化形式,则可以追溯到中世纪时期。而现代的股票交易活动,则以1792年纽约股票证券交易所成立为标志。世界股票市场经过萌芽、发展,逐渐走向繁荣,股票逐渐被投资者们所熟悉并且受到了广泛的欢迎。目前,股票市场在全世界的大部分国家和地区已经成为金融市场中不可或缺的重要组成部分,为这些国家和地区金融市场的繁荣和企业竞争力的提升起到了积极和关键的推动作用。从1980年抚顺红砖第一次发行股票算起,改革开放以后当代中国的股票市场已经有了近26年的历史,这段历史可以划分为三个阶段。一是1980年至1991年的起步和复兴阶段。从第一张真正意义上的股票问世,截至1990年12月上交所开业之时,上海只有延中实业、爱使电子、真空电子、飞乐股份、豫园商场、申华股份、浙江凤凰八家公司发行了股票,这就是所谓的上海老八股。深圳证券交易所1991年7月开业时,有5只股票上市交易,它们分别是深发展、深万科、深金田、深安达、深原野,后来被称为深市老五股。二是1992年至1999年的扩容和成长阶段。1992年初,邓小平南巡讲话从思想上排除了我国股票市场发展的障碍。股票市场的功能得到越来越多人的认同,大量国企纷纷改制上市,上市公司数量迅速增加,股票市场在国民经济中的地位不断提升,对国民经济的影响力、辐射力、推动力在不断加大。三是2000年至今的规范和发展阶段。2000年之后的我国股市进入了深入发展,制度不断完善、规范时期。制度改革,使市场日趋规范化是这一阶段的显著特点。2000年3月16日,中国证监会发布《中国证监会股票发行核准程序》及《股票发行上市辅导工作暂行办法》、《信誉主承销商考评试行办法》、2001年10月16日《首次公开发行股票辅导工作办法》、2004年12月7日《关于首次公开发行股票试行询价制度若干问题的通知》等配套规章,由此拉开了股票发行制度由审批制向核准制的转变。经过近二十年的发展,证券市场的构成已经比较完备,但各参与主体在制度上仍然存在较大缺陷,成为股票市场进一步发展有待解决的问题。二、股票投资价值理论研究意义(一)有利于股东及潜在的投资者制定正确的投资决策就长期持有而言,股票投资可获得相当的股利收入,而短线操作也可能给投资者带来一定的收益,因为从股价的波动可获得比股利更高的差价收入,因而股票投资已越来越成为一般大众所乐于选择的投资工具。我国股市尚处于初创阶段,它还有很多不完善,不规范之处,国家为了使其健康、规范地发展而采取一些人为的干预措施是不可避免的,这就使得我国股市在一段时期内受国家政策的影响比较大。但从发达国家的证券市场的状况分析,在一个规范完善的证券市场中,投资者据以入市的依据是上市公司财务状况、经营业绩及发展潜力等。财务状况与经营业绩好的上市公司的股票即所谓的绩优股倍受投资人的青睐,而绩优股也更能经受住股市振荡的考验。那么,针对上市公司的业绩前景、财务结构、盈利能力等进行的综合评价研究可为更多的投资者做出正确、合理投资决策,最大限度地规避风险,提高投资报酬率。(二)有利于公司加强内部管理上市公司的信息披露制度要求公司的财务状况、经营业绩必须公开,使得企业的发展置于社会和广大股东的关注和监督之下,依据公开的信息进行分析,就可以全面、系统地了解整个公司的生产经营情况,及时发现经营活动中存在的问题,迅速做出决策,采取有效措施,改善生产经营管理,同时也可利用分析结果,为未来的经营计划和经营方针提供决策的依据,不断增长业绩,以期给投资者一个满意回报。(三)有利于政府及监管部门对其进行评价、指导或监督判断上市公司是否具有投资价值的途径,是分析评价上市公司的综合发展力,通过分析评价上市公司与非上市公司、一般企业的差别,从而评判上市公司的运营是否优于非上市公司,并从中凸显股份制改造的作用。证监会、证券交易所等可根据公司营运情况、经营业绩等判断公司的各项经营是否合法,资金使用是否得当等。(四)有利于促进整个资本市场的健康发展目前越来越多的投资者开始重视理性投资,对上市公司的分析已成为证券公司和很多投资者的基础工作之一。但对上市公司的分析中存在着良莠不分,
2. 如何进行大数据分析及处理
探码科技大数据分析及处理过程
聚云化雨的处理方式
聚云:探码科技全面覆盖各类数据的处理应用。以数据为原料,通过网络数据采集、生产设备数据采集的方式将各种原始数据凝结成云,为客户打造强大的数据存储库;
化雨:利用模型算法和人工智能等技术对存储的数据进行计算整合让数据与算法产生质变反应化云为雨,让真正有价值的数据流动起来;
开渠引流,润物无声:将落下“雨水”汇合成数据湖泊,对数据进行标注与处理根据行业需求开渠引流,将一条一条的数据支流汇合集成数据应用中,为行业用户带来价值,做到春风化雨,润物无声。
3. 金融模型——多因子模型归因
本文主要详细介绍怎么使用多因子模型对组合资产进行归因分析,归因分析的内容为收益归因和风险归因。
上图列出了由马克维茨均值方差理论引出的三条路,其一为资产配置,我们本文不涉及,其二为资本资产定价(CAMP)的一条路,其三为套利定价理论(APT)的第三条路。第二条路和第三条路为本文讨论重点。
第二条和第三条路都是属于多因子分析的范畴,第二条路是知道因子收益的时间序列,通过时间序列上的回归去求因子暴露,为的是解释个券收益的组成部分。第三条路是知道截面因子暴露去回归截面上的因子收益,为的是挖掘有效因子,找到这个因子带来的超额收益。
使用多因子模型进行投资组合的归因分析,也主要包括基于净值的归因方法和基于持仓的归因方法两大类。基于净值的归因方法是走的第二条路,比较简单。基于持仓的归因方法走的是第三条路,比较复杂。
两者的区别主要表现在三个方面:
1、基于净值的归因方法是时间序列回归,基于持仓的归因方法是截面回归;
2、基于净值的归因方法主要来自CAMP(资本资产定价)模型,基于持仓的归因方法主要来自APT(套利定价)理论。
3、基于净值的归因方法要求比较简单,数据较少且较容易获取,仅需要组合的净值数据以及因子收益序列即可进行分析。而基于持仓的归因方法需要知道具体的组合权重、个股因子暴露等数据,来确定组合的因子暴露。
下面详细介绍两大类方法。
在介绍两个方法前,我们下面给出项目的框架如下图:
基于净值的归因方法,逻辑上很简单,它来自资本资产定价模型,用所有因子收益的时间序列去回归组合收益的时间序列。这样做的目的是,是把组合的收益分解在各个特定的因子上,认为组合或者个股的收益都可以被给定的特定因子收益加个股特质收益来解释,解释不了的部分直接扔给残差。这里要特别注意,此时特定因子收益在一个时间截面上是一个常数,对多所有股票都一样,这与另一种方法基于持仓的归因方法有本质的区别。
基于这种方法,人们开发出的模型很多,如下:
1、Fama-French三因子模型
2、Carhart四因子
在 FF 三因子模型的基础上,引入动量因子 UMD (高收益率股票组合与低收益率股票组合 收益率之差)
3、Fama五因子模型如下:
我们这里以Fama五因子模型为例,详细介绍这种方法的实现。
Fama五因子模型如下:
因为本文主要是项目实施前的参考文档,所以在此不介绍Fama五因子模型怎么得来的。只需要知道Fama五因子模型是上面公式。
其中,
表示资产 i 在时间 t 的收益率,
表示时间 t 的无风险收益率,
表示时间 t 的市场收益率,
即为时间 t 的风险溢价,
为时间 t 的市值因子的模拟组合收 益率(Small minus Big),
为时间 t 的账面市值比因子的模拟组合收益率(High minus Low),
为时间 t 的盈利因子的模拟组合收益率(Robust minus Weak),
为时间 t 的投资因子的模拟组合收益率(Conservative minus Aggressive),
为经过正交化 调整的估值因子模拟组合收益率,其余各变量含义与三因子模型相同。
均为回归待拟合系数,𝜖_{𝑖𝑡} 为残差项。
有了模型,下面我们具体去实现。
我们遵循机器学习项目的步骤,将Fama五因子模型归因分析的实现,归结为以下流程。
数据准备>>数据预处理>>构造Fama五因子>>数据分析>>回归分析>>归因分析
(1) 股票池:全A股,在每个时刻t均剔除ST、PT股票,剔除停牌及上市未满一个月的股票,剔除 BP 值为负的股票;
(2) 时间参数:2010年1月至2018年1月;
(3) 因子对应指标:
a) 市场因子指标:上证 指数;
b) 规模因子指标:总市值 = 每股股价 × 发行总股数;
c) 估值因子指标:账面市值比 BP,即市净率的倒数;
d) 盈利因子指标:扣除非经常性损益、摊薄的 ROE;
e) 投资因子指标:当期总资产相对上期总资产变化率;
f) 无风险利率设为零,个股收益率用 Wind 后复权收盘价核算;
g) 以自然月为频率,计算因子值并重新分层计算对应五因子收益率。
1、所有数据按同一时间,同一股票对齐,注意这里的财报指标相关的时间要使用财报公布时间不能使用财报报告期。
2、第一步产生的NA值,用前一个值去填充(因为这里回归的方式是时间序列回归)。
Fama 和 French(2015)原始的方法,是沿着某两个因子维度将股票分成 2x3=6 个组合(图表 2,3)。在这 2 个因子维度中,其中一个固定为规模,按照中位数分为两层, 另外一个为 BP、盈利或者投资因子,按照 30%,70%分位数分成 3 层(图表 3)。这样, 我们将得到 3 个 2x3 的股票资产组合(规模与 BP 两维度分组、规模与盈利两维度分组、 规模与投资两维度分组)。
因子的构造方法以及计算细节见下面表 1 和 2。在图表 2 中,我 们用 2 个字母来标记股票的分组,第一个字母表示规模大(B)或小(S),第二个字母在 BP 分层中,表示 BP 高(H)、中(N)、低(L);在盈利分组中表示强(R)、中(N)、弱(W);在投资 分组中,表示投资保守(C)、中(N)或者强(A)。
表1
表2
最后我们得到除了市场因子以外的 4 个因子 收益率为:
(1) SMB (small minus big):小市值组股票减大市值组股票平均月收益率;
(2) HML(highminuslowBP):高BP组股票减低BP组股票平均月收益率;
(3) RMW(Robustminusweakprofit):高ROE组的股票减低ROE组股票平均月收益率;
(4) CMA():总资产增长率低组股票减总资产增长率高组股票平均月收益率。
数据分析部分主要分析五因子组成数据的特性。其主要分析四部分内容:
1、五因子的均值,方差等summary统计。这样能说明那个因子在市场的收益中起到作用。
2、求均值是否显著异于零的假设检验对应的 t 统计量。目的是检验哪一个因子最能带来超额的收益。
3、五因子累计收益分析,一般是规定一个日期为起始日期,形成五因子的累积净值曲线,目的是用来分析五因子在历史上和现在的表现,和预估未来的表现。后面归因分析中会用到这里的累积。
4、五因子间的相关性分析。其目的是提出多吃公线性,用作下一步回归用。
这里可以剔除多重共线性,也可以不剔除,因为Fama在原始论文中就发现了了五因子中存在多重公线性,但是Fama并没有处理这个问题。所以这里也可以不处理。
去除多重共线性的方法为:
分别用4个因子对另一个因子进行线性回归,可以找到共线性因子,找到共线性因子后。
用四个因子去回归这个共线性的因子,生成的残差,作为这个因子的新值,这样既做可以去掉共线性,也因为是线性变化,不改变因子的方向。这种去除共线性的方法,使用与所有的多因子模型。包括APT多因子模型。
我们有了Fama五因子,将组合的收益时间序列作为因变量,直接进行回归,即可求出模型:
在求出模型的同时,求出回归的可决系数,检验模型的因子解释的有效性。
我们由五因子的累积净值走势图,可以分析出历史和当前那个因子起到主要作用,通过上面方差的回归系数,我们可以发现我们组合的收益来源,如果组合的主要收益来源和当前五因子收益表现最好的不一致,就要考虑进行调仓,高配表现好的因子。这就是基于净值的收益归因。
既然这里目标变量是组合的收益率,那么有上面模型,我们可以由因子的风险矩阵求出组合的总风险,且每一个因子的风险贡献都可以求出,道理和风险预算模型一致。这就是基于净值的风险归因。
额外的,在这个模型可以用来选股,我们选择 很小的股票和资产,因为这种股票和资产收益和风险可以被五因子所解释,风险小, 大的说明还有很多不能被五因子解释的部分,风险也大。
所以,我们使用Fama多因子选股的时候,只需用五因子回归市场上每一个股票,对生成的残差 有小到大排序,选择残差 小的股票。
基于持仓的归因方法,逻辑上比基于净值的归因方法要复杂的多,它来自套利定价模型(APT),用所有所有股票截面的因子的暴露序列去回归所有股票的收益序列。这种做法的目的是找到个股收益和因子收益之间的关系,寻找有效因子,通过有效因子来选择好的股票。
这种做法把重点放在了因子挖掘和最后资产的打分模型的选择上。
最后的模型打分,最后主要开发出来以下模型:
分层打分法、简单线性回归、随机森林、逻辑回归、支持向量机回归。
本文以简单线性回归为例,详细介绍这种方法归因分析的实现。
我们还是遵循机器学习的项目流程,来进行实现:
数据准备>>数据预处理>>单因子有效性检验>>数据分析>>回归分析>>归因分析
(1) 股票池:全A股,在每个时刻t均剔除ST、PT股票,剔除停牌及上市未满一个月的股票,剔除 BP 值为负的股票;
(2) 时间参数:2010年1月至2018年1月;
(3) 因子对应指标:
a) 市场因子指标:上证 指数;
b) 行业因子指标:申万一级行业指数。
c) 风格因子指标:市值size,PE,EBITA.(这里以这三个因子为例,APT框架的优势就是因子可以随便加)
1、所有数据按同一时间,同一股票对齐,注意这里的财报指标相关的时间要使用财报公布时间不能使用财报报告期。虽然这种方法是截面回归,但是要研究每个因子的有效性,所以必须列出各个因子的历史时间序列数据。
2、第一步产生的NA值,用截面该因子的均值填充。(这与上面的做法不一样)。
3、若因子NA比率超过30%,则舍弃该因子。
4、对每个因子的暴露(就是因子值)分布分析,剔除3-sigma以外的公司。(最后回归用,因为回归对极值敏感)
5、z-score标准化所有因子。(最后回归用,去量纲)
通常我们总认为行业和市值两个因子对股票的收益影响较大,所以在单独分析其他因子时,要把这两个因子暴露引起的收益剔除掉,也就是所谓的因子中性化。经常使用的方法是,用因子暴露作为因变量,用行业因子和市值因子去回归因子暴露,得到的残差就是中性化后的因子。
在这个过程中,因为行业是类别变量,不能直接进行回归,要引入哑变量的方式进行回归。
注意:因子暴露此时已经变成中心化的,所以一下处理全在中性化因子的基础上。
整个模型最麻烦的一步,也是最琐碎的一步。
在剔除了极端公司和填充了因子NA值后,我们对每个单因子进行有效性检验。做法有以下几种:
1、IC值检验
2、RIC值检验
3、IR检验
4、方差分析(ANOVA)给出p-value
5、随机森林
这里我们要先再确认下因子收益和因子暴露的概念:
因子暴露是因子具体的值,例如60000.sh(浦发银行)的PE(因子)值为5.62.纳闷普法银行在因子PE上的暴露就是5.62。
因子收益是用截面因子暴露去回归个股收益时产生的各项因子的回归系数。
为什么这样定义,其实原因来自上面的基于CAMP模型多因子分析。
我们有各个因子的暴露值后,可以对各个因子进行单因子检验,我们求当期(t期)的因子暴露值和下一期(t+1期)的个股收益的相关性数,得到当期(t期)的该因子的IC值:
其中:
这样求出来的IC值的绝对值越大越好,求出所有因子历史一段时间的IC值走势。因子IC的绝对值长时间处于很大的值,说明这个因子长期有效性很强,若偶尔绝对值很大,说明因子偶尔有效,也要保留,我们剔除那些IC长期很小的因子。认为这些因子有效性不强。
RIC的用法与IC的用法完全一致,只有RIC的定义不一样,我们求当期(t期)的因子暴露值和下一期(t+1期)的个股收益的秩相关性数,得到当期(t期)的该因子的RIC值:
其中:
RIC使用方式和IC一致。
从上面使用IC和RIC时,不是很方便,我们要看IC和RIC长期表现,这种表现是定性看的,我们需要构造一个量,定量的去衡量因子的长期表现。我们很简单的一个想法是:用IC的均值来衡量IC的长期表现好坏,用IC的标准差来衡量表现的稳定性。
于是我们综合两个在一起,构造IR如下:
这里的符号IR与信息比率是一样的,因为两者是一个东西,可以通过数学推导得到。
我们选取IR高的因子,丢弃IR低的因子。
方差分析是用来分析多组数据之间均值是否一样的统计分析方法,当检验的p值大与0.05是,说明多组之前的均值没有差异,当p值小于0,05 时,说明各组之间存在差异。对于选因子来说,我们希望每组之前有差异。所以p-value需要小于0.05.
P值的计算方式很复杂,其思想是用组内方差处于组间方差构造统计量,进行F检验。可直接调用python方差分析函数。
本步主要查看上一步选出的各个因子之间相关系数,为解决下面回归中的两两共线性问题,我们要合并部分因子,我们设置阀值0.6.认为相关系数在0.6 以上的因子看作同一组因子。
对同一组的因子,我们采用IC_IR加权的方式合并这些因子,将其合成一个因子。
其具体加权方式为: 。
这样我们就得到了组合因子。但是这一步虽然剔除了两两间的共线性,但是未能剔除多重共线性。
本步对上面筛选出的因子,以个股收益为因变量惊喜建模,常用模型为多元线性回归,获得如下回归方程:
其中: 是股票n在因子k 上的暴露。 为因子k的因子收益, 为股票n的残差收益,既股票特有收益率。
由这个回归方程,用最小二乘发,我们可以得到因子k的收益 。
进一步的,若现有一组合P,则这个组合P的收益率为:
其中: 为组合P中股票n的权重。
所以组合在因子k上的暴露设为 为:
所以此时,我们知道了组合的因子暴露,各因子的收益,所以可以得到组合里面个因子的收益贡献 :
所以,此时的多因子模型收益归因归因。
这里的风险归因分析和Barra一模一样:
由上面回归模型得到(将其向量化表示):
其中:r为股票的收益向量,X因子的暴露矩阵,f为股票的因子收益向量,u为股票的特质收益。
则我们的组合P的波动率为:
其中: 为所有因子收益学列的协方差矩阵,𝛥为股票特质收益序列的协方差矩阵。w为持仓权重。具体推导详见马克维茨均值方差理论。
有了组合的风险(既波动率),就可以得到以下三个量:
组合的系统风险:
组合的特质风险:
因子𝑖对总风险的贡献比例为(推导详见风险预算):
以上就是多因子模型在风险归因上的应用。
传统的这一版多因子,另一大作用是用来选股的,我们得到以下回归方程的时候。
最简单的,可以把最新一期的因子带入到回归方程,计算出的个股的的未来收益,将其线性映射到1到100,可以直接作为分数,我们选择分数高的股票即可。一般都是直接做前10%,做空后10%获得超额收益。
4. 股票分析2NS是什么意思
多因子分析的意思
5. 怎样提高KMO值和累积贡献率
我们在投资的时候需要比对不同股票的实力,这时候就需要运用到spss计算。 Spss计算中有两个非常重要的数值需要观测,这就是KMO值和累计贡献率。那这两个数值怎么提高呢?由小编告诉你吧。
- 三、总结
这两个数值是很重要的,所以在分析的时候如果数值过低,要想办法将它们提高,这样才能进行更好的投资,获得更多的收益。
6. 国泰安数据库 股票市场类型
P9705:创业板;P9706:综合A股市场;P9707:综合B股市场;P9709:综合A股和创业板; P9710:综合AB股和创业板;P9711:科创板;P9712:综合A股和科创板;P9713:综合AB股和科创板;P9714:综合A股和创业板和科创板;P9715:综合AB股和创业板和科创板。
7. 分类数据分析中的拟合优度检验
知识图谱
继续我们的知识总结,本文总结包括:多选题研究、聚类分析研究、权重研究、非参数检验、数据分布。
查看本系列之前的文章,可点击下面的链接:论文里的分析方法要用哪一种,SPSSAU告诉你答案论文常用数据分析方法分类总结-2
11. 多选题研究
多选题分析-SPSSAU
多选题分析可分为四种类型包括:多选题、单选-多选、多选-单选、多选-多选。
“多选题分析”是针对单个多选题的分析方法,可分析多选题各项的选择比例情况
“单选-多选”是针对X为单选,Y为多选的情况使用的方法,可分析单选和多选题的关系。
“多选-单选”是针对X为多选,Y为单选的情况使用的方法。
“多选-多选”是针对X为多选,Y为多选的情况使用的方法。
12. 聚类分析
聚类分析-SPSSAU
聚类分析以多个研究标题作为基准,对样本对象进行分类。
如果是按样本聚类,则使用SPSSAU的进阶方法模块中的“聚类”功能,系统会自动识别出应该使用K-means聚类算法还是K-prototype聚类算法。
如果是按变量(标题)聚类,此时应该使用分层聚类,并且结合聚类树状图进行综合判定分析。
13. 权重研究
权重研究-SPSSAU
权重研究是用于分析各因素或指标在综合体系中的重要程度,最终构建出权重体系。权重研究有多种方法包括:因子分析、熵值法、AHP层次分析法、TOPSIS、模糊综合评价、灰色关联等。
因子分析:因子分析可将多个题项浓缩成几个概括性指标(因子),然后对新生成的各概括性指标计算权重。
熵值法:熵值法是利用熵值携带的信息计算每个指标的权重,通常可配合因子分析或主成分分析得到一级权重,利用熵值法计算二级权重。
AHP层次分析法:AHP层次分析法是一种主观加客观赋值的计算权重的方法。先通过专家打分构造判断矩阵,然后量化计算每个指标的权重。
TOPSIS法:TOPSIS权重法是一种评价多个样本综合排名的方法,用于比较样本的排名。
模糊综合评价:是通过各指标的评价和权重对评价对象得出一个综合性评价。
灰色关联:灰色关联是一种评价多个指标综合排名的方法,用于判断指标排名。
14. 非参数检验
非参数检验-SPSSAU
非参数检验用于研究定类数据与定量数据之间的关系情况。如果数据不满足正态性或方差不齐,可用非参数检验。
单样本Wilcoxon检验用于检验数据是否与某数字有明显的区别。
如果X的组别为两组,则使用MannWhitney统计量,如果组别超过两组,则应该使用Kruskal-Wallis统计量结果,SPSSAU可自动选择。
如果是配对数据,则使用配对样本Wilcoxon检验
如果要研究多个关联样本的差异情况,可以用多样本Friedman检验。
如果是研究定类数据与定量(等级)数据之间的差异性,还可以使用Ridit分析。
15. 数据分布
数据分布-SPSSAU
判断数据分布是选择正确分析方法的重要前提。
正态性:很多分析方法的使用前提都是要求数据服从正态性,比如线性回归分析、相关分析、方差分析等,可通过正态图、P-P/Q-Q图、正态性检验查看数据正态性。
随机性:游程检验是一种非参数性统计假设的检验方法,可用于分析数据是否为随机。
方差齐性:方差齐检验用于分析不同定类数据组别对定量数据时的波动情况是否一致,即方差齐性。方差齐是方差分析的前提,如果不满足则不能使用方差分析。
Poisson分布:如果要判断数据是否满足Poisson分布,可通过Poisson检验判断或者通过特征进行判断是否基本符合Poisson分布(三个特征即:平稳性、独立性和普通性)
卡方拟合优度检验:卡方拟合优度检验是一种非参数检验方法,其用于研究实际比例情况,是否与预期比例表现一致,但只针对于类别数据。
单样本T检验:单样本T检验用于分析定量数据是否与某个数字有着显著的差异性。
上述分析方法均可在SPSSAU中使用分析,以及相关方法问题可查看SPSSAU帮助手册。
8. 什么是拟合指数
拟合指数 : 就是选择的变量与被解释变量之间的相关关系 。
指数基金是一种拟合目标指数、跟踪目标指数变化为原则,实现与市场同步成长的基金品种。指数基金的投资采取拟合目标指数收益率的投资策略,分散投资于目标指数的成分股,力求股票组合的收益率拟合该目标指数所代表的资本市场平均收益率。
9. 在构建多因子模型之前,如何对单因子效果进行检验
在构建多因子模型之前,如何对单因子效果进行检验?
结果分析:
20日RSI回测10日年化收益27.2%,回测5日年化33.9%。我们还对4日、8日、14日RSI因子进行检验,发现4日RSI因子的效果较差,8日、14日、20日RSI因子效果相似,比较有效。
10. 如何计算股票的理论价值(真实价值)
根据行业不同,其价值与财务的一些指标也是不一样的,比如钢铁股,它的价值应该是每股赢利*10,但要是航空,或酒类,很明显这个价值是太低了,所以,这也是需要一种经验的,你在股市呆时间长了,毕竟会知道每一个版块的价值应该是多少,不过如果你非要想好好学学的,那就学学上市公司财务报表分析吧,不过这对一般的股民比较难,它比如要具备会计的知识,金融的知识和货币银行学的知识,所以你根据自己的能力来选择是凭经验还是凭理论吧,金融投资本来就是个专业的工作,其实散民在没有什么相关知识而匆忙入市,这也是中国股市有那么多"捐躯者"的原因,我是学金融专业的,而且也在股市里做了几年,深知还是从理论开始学比较好的,有问题可以联系我,