基于粒化SVM的互联网金融产品大数据回测分析

来源 :现代商贸工业 | 被引量 : 0次 | 上传用户:xiaojiaoechou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着大数据时代的到来,数据挖掘技术正日益渗透到各行各业。基于数据挖掘技术挖掘出掌柜钱包的基本面数据,其目的是为了获取投资的标量信息。随后建立支持向量机的指数回归预测模型,通过模型回测判断预测效果良好。为了更好的判断未来价量信息的走向,因此采用基于模糊信息化的支持向量机指数预测模型,以每周信息为一个信息点,所得到结果准确。
  关键词:大数据;信息粒化;支持向量机;指数预测
  中图分类号:F23文献标识码:Adoi:10.19311/j.cnki.1672-3198.2019.16.046
  1引言
  “掌柜钱包”是兴业全球基金与兴业银行联合推出的互联网的理财存取业务,该业务于2014年3月10日上线运行,自上线以来在同類104只货币基金多次排前两名,截至2018年12月,资金规模达460亿元,在货币基金市场排名第五。在掌柜钱包广受欢迎的同时,我们也要对其进行预警研究,而本文使用的技术分析就是一种比较有效的方式。
  技术分析注重对金融市场历史数据的研究,通过图表展现预测价格走势和投资策略分析。在理论上,技术分析只考虑市场或金融工具的实际价格行为,并认为价格会通过其他渠道反映所有投资者的相关因素。技术分析是一种证券交易的基本分析方法,也是实际操作是最大的分析方法。关于技术分析的运用和市场交易的有效性,学术界和实务界一直存在争议。但从实践角度,为了更好地理解和运用技术分析,实现投资收益,减少被动风险其研究也是非常有意义的。一个衡量风险的指标是MSE,而本文运用的SVM能够有效性的检验误差。
  2文献综述
  随着金融市场的扩张、金融风险预警的发展,技术分析较传统投资优势逐渐显现。Markowitz在1952年发表的《投资组合选择理论》中提出了均值-方差模型,开创了现代投资组合理论。紧接着William Sharpe 1964年对资产组合模型进行了简化,提出了资本资产定价CAPM模型,阐释了单一投资回报率与标准投资组合的投资回报率之间的相关性。随后Stephen Ross在1976年提出了套利定价APT模型,认为如果市场未达到均衡状态并且不考虑交易成本等中间因素,就会存在无风险套利机会。从而将资本资产定价理论推向了一个新的研究阶段。
  近些年,机器学习技术在技术投资领域得到了快速发展,SVM作为一个常用的技术有了大量的研究。MAH Farquad 提出在解决财务问题的银行信用卡客户的流失预测和保险中的欺诈检测,SVM能够敏感性的判断,实证结果表明,所提出的改进的基于主动学习的SVM方法产生了最佳灵敏度,并且减少了规则的长度和数量,从而提高了可理解性。 L.Zhang提出SVM在供应链金融管理供应商和客户管理之间的需求,建立一个认证管理系统,从而提高了中小企业融资过程的信用评级状况。胡海清等提出了供应链金融模式下的信用风险管理,利用SVM建立风险评估体系,证实了风险评估的有效性。Hsu, Ming-Wei等提出将机器学习方法应用到金融时间序列预测上,金融市场的可预测性和基于模型的盈利交易的可行性受到市场成熟度、所采用的预测方法、预测产生的时间范围以及评估模型和模拟模型交易的方法的显著影响,且SVM预测所得到的效果显著。Shom Prasad Das等提出SVM-TLBO模型避免了用户指定的控制参数,通过预测COMDEX商品期货指数的每日收盘价来评估该混合模型的可行性和效率。实验结果表明,该模型是有效的,并且比粒子群优化(PSO)+ SVM混合和标准SVM模型表现更好。例如,与标准SVM回归相比,该模型将平均绝对误差提高了65.87%(提前1天预测),55.83%(提前3天预测)和67.03%(提前5天预测)。更多的,Johana等人分析了59篇关于SVM和金融时间序列的分析进展,结论表明SVM比传统的时间序列方法更准确。
  3粒化支持向量机理论介绍
  3.1相关理论
  20世纪90年代初Vapnik等人根据统计学习理论提出了一种新的机器学习方法,即SVM方法。该方法以结构风险最小化原则为理论基础,通过适当地选择函数子集及该子集中的判别函数,使学习机器的实际风险达到最小,保证了通过有限训练样本得到的小误差分类器,对独立测试集的测试误差仍然较小。在支持向量和输入空间抽取的向量之间的内积核是构造支持向量机学习算法的关键。其中支持向量机是由算法从训练数据中抽取的小子集构成。其种类主要有:
  线性核函数:K(x,xi)=xTxi ;
  多项式核函数:K(x,xi)=(γxTxi+r)p,γ>0;
  径向基核函数:K(x,xi)=exp(-γ||x-xi||2),γ>0;
  两层感知器核函数:K(x,xi)=tanh(γxTxi+r)
  通过对比发现,虽然对掌柜钱包进行了回归预测,但是大多数时候无法对指数进行精确预测,如果能够对开盘指数和变化空间进行预测就显得很重要。利用SVM对进行模糊信息粒化后的每日开盘指数进行变化趋势和变化空间的预测。
  信息粒化由美国数学家Lotfi A.Zahdeh 教授提出,是粒化计算和词语计算的主要方面,研究信息粒化的形成、表示、粗细、语义解释等。从本质上讲,信息粒化是通过不可区分性、相似性、功能相近性、函数性等来划分对象的集合。是将一个整体分解为一个个相似的元素部分进行研究,每个部分为一个信息粒。这种信息粒命题表达方式为:
  gΔ-xisGisλ 或者gΔ-xisG
  其中x是论域U中取值的变量,G是U的模糊子集,由隶属函数μG来刻画。λ表示可能性概率。一般假设U为实数集合RR'',G是U的凸模糊子集,λ是单位区间的模糊子集。
  3.2“掌柜钱包”技术分析模型构建
  选取数据:每一行表示每一个交易日的掌柜钱包指数各种指标,6列分别表示当天指数的开盘指数,指数最高,指数最低值,收盘指数,当日交易量,当日交易额。   模型目的:利用SVM建立的回归模型对指数每日的开盘数进行回归拟合
  模型假设:指数每日的开盘数与前一日的开盘指数,指数最高值,指数最低价,收盘指数,交易量和交易额相关,即把前一日的开盘指数,指数最高值,指数最低价,收盘指数,交易量和交易额作为当日开盘指数的自变量,当日的开盘指数为因变量。
  在给定的训练样本x1,y1,...,xn,yn,i=1,2,...,n,采用不敏感损失函数算法,寻找回归函数f(x,α)=wx+b中的参数w,b,将问题转化为:
  min12w2+C∑ni=1ξi+ξ*i
  s.t.(wxi+b)-yiSymbolcB@
  ε+ξiyi-(wTxi+b)SymbolcB@
  ε+ξ*iξi,ξ*i0,i=1,2...n
  引入拉格朗日函數可以得到对偶规划
  min12∑ni,j=1α*i-αiα*j-αjxixj+ε∑ni=1α*i+αi∑nj=1yiα*j-αj
  s.t.∑ni=1(α*i-αi)=00SymbolcB@
  αi,α*iSymbolcB@
  C,i=1,2...n
  对于非线性回归类似,可以通过核函数来实现。
  目前比较常用的核函数类型有:
  线性核函数:K(x,xi)=xTxi ;
  多项式核函数:K(x,xi)=(gxTxi+r)d;
  高斯核函数:K(x,xi)=exp(-g‖x-xi‖2) ;
  Sigmoid核函数:K(x,xi)=tanh(gxTxi+r)
  支持向量机的核函数以及参数的选取对其目标的预测性能有很大的影响,从现有的研究成果来看,大多数情况下最常用的核函数-高斯核函数都获得了较好的预测效果,因此本文借鉴已有的研究成果采用高斯核函数进行研究。此时的支持向量机存在两个需要调节的参数:惩罚参数c和高斯核函数参数g。上述算法流程如图1所示。
  对于掌柜钱包的有效预测可以从整体上观测股市的变化提供强有力的信息,所有对掌柜钱包的预测很有意义,通过对掌柜钱包的开盘至今的每日开盘数据进行回归分析。
  4结果分析
  通过使用核函数-高斯核函数的研究网络搜索法来对高斯核函数g和惩罚参数c进行优化选择实现。选择回归预测分析最佳的SVM参数c&g。
  利用上面得到的最佳参数c和g对SVM进行训练,然后再对原始数据进行回归预测,得出图1、图2。利用回归预测分析最佳的参数进行SVM网络训练。
  利用网格搜索法最终得到的拟合结果为:均方误差MSE=0.000362,相关系数R = 98.56%,在95%的置信区间下,预测的准确率为93.98%,预测效果良好。利用高斯核函数的强大回归,得到的效果良好。
  对上一个模型进行改良的上面是对一个指标进行回归预测,而这里进行的是对3个指标(最低价,平均价,最高价)进行回归预测,得到的是一个区间进行说明,其准确性更高。
  利用SVM对模糊粒子Low进行回归预测。基于上面寻得的参数,利用支持向量机回归预测。
  对于Low的拟合结果分析,利用上面得到的最佳参数训练和预测,最终Low模型得到的拟合效果为:
  均方误差MSE=0.0045
  相关系数R =85.90%
  接下来5个交易日的平均模糊粒子参数:
  predict_low =1.3321
  再次利用SVM对R、Low进行回归预测。最终结果如下,求得的模糊粒子参数最低值Low,平均值r,最高值Up的预测值分别是:
  [Low,R,Up]=[1.3321, 13652, 1.4022]
  通过与接下来的几天进行实证分析其结果确实是在里面,证明回测成功。通过截取2019年1月2-4日的K线图,可以证明拟合效果良好。
  5结论及未来工作
  在粒化SVM建模回测过程中没有考虑手续费和冲击成本等因素,仅仅是一个大概的测试结果,其目的是为了说明使用SVM交易策略建模的思想和过程。本节提出的模型也可以扩展到小时级别,分钟级别等其他频率交易数据模型的构建。
  虽然技术投资分析在我国尚处于发展起步阶段,但2010年以来发展态势快速,未来发展前景广阔。近些年来机器学习的大力发展也为金融技术投资分析提供了理论基础,也让技术投资不失为一种非常高效的金融分析方法。值得注意的是,虽然技术投资是一种客观、高效、无偏的投资方式,但投资者也不能过度依赖,毕竟市场的多变性和有效性都会给技术投资带来诸多挑战,因而需要充分发挥金融工程师的创造力,不断挖掘创新投资模型。相信随着大数据技术、人工智能的快速发展,技术投资在国内会有更好的发展势头。
  参考文献
  [1]Kamla Ali Al-Busaidi.Aligning customer knowledge management tools with business strategy[J].International Journal of Electronic Customer Relationship Management, 2013,(7):2,117-134.
  [2]Markowitz H.Portfolioselection[J].The journal of finance, 1952, 7(1):77-91.
  [3]Sharp, W.F., Capital asset prices: A theory of market equilibrium under condition ofrisk[J].Journal of Financial Economics, 1964,19(3):425-442.   [4]Cox J C, Ross S A.The valuation of options for alternative stochasticprocesses[J].Journal of financial economics, 1976, 3(1-2): 145-166.
  [5]Zhang L, Hu H, Zhang D.A credit risk assessment model based on SVM for small and medium enterprises in supply chainfinance[J].Financial Innovation, 2015, 1(1):14.
  [6]胡海青,張琅,张道宏,陈亮.基于支持向量机的供应链金融信用风险评估研究[J].软科学,2011,25(05):26-30+36.
  [7]Hsu M W,Lessmann S, Sung M C, et al.Bridging the divide in financial market forecasting: machine learners vs.financial economists[J].Expert Systems with Applications, 2016, (61): 215-234.
  [8]Jaramillo J, Velasquez J D, Franco C J.Research in financial time series forecasting with SVM: Contributions from literature[J].IEEE Latin America Transactions, 2017, 15(1):145-153.
  [9]Das S P,Padhy S.A novel hybrid model using teaching–learning-based optimization and a support vector machine for commodity futures index forecasting[J].International Journal of Machine Learning and Cybernetics, 2018, 9(1): 97-111.
  [10]张卫国,卢媛媛,刘勇军.基于非均衡模糊近似支持向量机的P2P网贷借款人信用风险评估及应用[J].系统工程理论与实践,2018,38(10):2466-2478.
  [11]Schumakerrp,Chenh.Textual analysis of stock market prediction using breaking financial news[J].The Journal of Finance,2009:5-19.
  [12]Chih-Chung Chang and Chih-Jen Lin.LIBSVM: A Library for Support Vector Machines[EB/OL].http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf, 2013.
  [13]Chao-Ton Su, Long-Sheng Chen,Yuehwern Yih.Knowledge acquisition through information granulation for imbalanced data[J].Expert Systems with Applications, 2006,(31):531-541.
  [14]J.Bollen,H.Mao and X.Zeng.Twitter mood predicts the stock market[J].Journal of Computational Science, 2011,(2):1-8.
其他文献
摘要:民营经济是我国国民经济的重要组成部分,是全面建成小康社会和现代化建设的重要力量。近年来,重庆市渝北区大力推动民营经济发展,取得了一定成效。然而,在发展的过程中依旧存在一些问题,据此,对其进行客观分析,并提出相应的对策建议,以期对促进民营经济健康发展有所裨益。  关键词:渝北;民营经济;障碍;路径  中图分类号:F2文献标识码:Adoi:10.19311/j.cnki.1672-3198.20
期刊
摘 要:创业实践活动的特点决定了创业类课程课堂教学创新的重要性。根据创业实践活动的规律,创业类课程课堂教学应提升学生质疑能力和解决问题能力为目标,激发学生思考问题的积极性,运用头脑风暴式的方法提高学生独立思考的能力以及创新能力。采用多种方式,真正落实学生在教学活动中的主体地位以及转变教师作为知识权威和垄断者的角色,变“学科教师”为学生“导师”,引导和鼓励学生自主学习和合作学习,真正促进学生能够成为
期刊
摘要:在考研热的大环境下,盲目跟风考研成为了一种常见现象。通过对本科生、研究生、本科就业者以及研究生就业者四个群体的研究,利用文献综述法、问卷调查法、访谈法等研究方法,从招聘者的角度,以及应聘者的角度分析考研于大学生的效用。并根据调查结果,客观给出考研建议,达到减少考研行为的盲目性。  关键词:考研热;价值;适配性;理性考研  中图分类号:F24文献标识码:Adoi:10.19311/j.cnki
期刊
摘要:对于金融专业的学生来说,《商业银行经营与管理》课程是非常重要的,通过学习该门课程可以了解银行的相关业务、经营管理方面的知识,但是光学习了书本知识,很多同学对于银行业务还只能是一知半解。通过笔者过去银行的工作经验,结合近年来带学生参加银行业务综合技能竞赛的实践发现通过比赛的实训,学生的实践能力得到显著提高,并且对于银行各类业务的认知也更加深入。因此,对“以赛促学”教学模式进行探讨,首先对《商业
期刊
摘要:参照国家发改委2016年颁布的电商评价指标体系试行标准,运用多层次模糊综合评价模型及层次分析法,构建出一套能科学反映电子商务示范城市建设进程和发展水平的评价指标体系,并以南宁市为例应用该评价体系,发现南宁市创建国家电子商务示范城市具备一定的基础,但部分二级指标与全国基准水平相比仍然存在一定差距, 并有针对性的提出了政策建议。  关键词:电子商务;多层次模糊综合评价模型;层析分析法  中图分类
期刊
摘 要:现阶段,选择在寒暑假兼职的大学生越来越多。兼职确实能给大学生带来诸多益处,如增长社会经验、提高适应社会的能力、减轻家庭负担等。政府、高校也都鼓励大学生在寒暑假兼职。但是,目前我国还没有形成系统而完善的兼职市场,大学生在兼职的过程中还存在一些问题,诸如安全、薪水得不到保障,易遇到网络、中介兼职寻找渠道骗局等。如何解决目前大学生兼职所面临的问题,促进大学生寒暑假兼职行为的健康发展是本项目研究的
期刊
摘 要:对中小企业跨境电子商务的竞争力进行研究,分析了在参与跨境电子商务过程中,中小企业存在的三个发展机遇和三个问题,为提高中小企业跨境电子商务的竞争力,有针对性的提出了四条建议。  关键词:中小企业;跨境电子商务;竞争力  中图分类号:F74 文献标识码:A doi:10.19311/j.cnki.1672-3198.2019.18.014  1 引言  在经济全球化背景下,各国贸易争端、贸
期刊
摘 要:通过对我国第四方物流信息平台发展现状及其与跨境电商之间的合作情况进行全面的调查分析,结合上海自身条件、新时期中国对外贸易的利好政策、自贸港的成立带来的关税和外汇政策上的放宽、跨境电商发展规模的扩大等优势,分析上海成为第四方物流平台与跨境电商合作的中心的必然性,研究跨境电商与第四方物流之间合作的扩大化、深入化、高效率化。  关键词:第四方物流平台;跨境电商;合作;自贸港  中图分类号:F25
期刊
摘要:为提高我国中小学教师的个人素质及整体的教学能力和业务水平,2010年教育部和财政部实施了中小学教师国家级培训计划。此后,各省市县也随之出台了相关的教师培训计划。以H省2013-2017年参与培训计划的老师为调查对象,调查此类培训计划是否能促进教师的专业发展,对其影响程度,以及教师对此类计划的满意度等情况。根据调查结果对中小学教师培训计划中其培训模式、培训课程设置等提出相关意见和建议。  关键
期刊
摘 要:随着PPP项目的大力推进,越来越多的交通项目采用了PPP模式。由于交通类项目投资巨大、收益较慢,因此PPP交通项目的资本结构显得尤其重要。据此,资本结构的核心问题是权益与债务的比例,或者资本金占总投资的比例。通过理论分析,论证资本结构的变化会如何影响整个项目的资金运转;通过WACC模型(加权平均资金成本模型)来探寻合理的资本结构的范围;最后,将用南京某轨道交通为例,通过模拟财务测算,探究资
期刊