因子分解机的拓展研究及其应用

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户:mdre8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因子分解机(FM)是最近被提出的主要用于解决大规模稀疏数据特征组合问题的算法,其本质是二阶多项式模型。得益于对交叉项的分解,FM能从稀疏数据中学到数据中隐藏的变量间相互关系。因此,FM比一般的多项式模型在面对稀疏数据时有更强的表达能力。本文立足于基本的FM模型,对其进行了充分的拓展研究和应用,具体成果如下:1)有序回归(OR)是一种特殊的机器学习范式,当类标号是有序时,有序回归能很好地利用有序的先验信息做分类。目前已经有很多方法被提出来用于解决有序回归问题,但是当前的方法很少去考虑有序问题中数据的内在结构问题,尤其是变量之间的交叉关系。因此,这些模型在一定程度上缺少可解释性。我们提出了新的基于因子分解机的有序回归方法:结合层次稀疏的有序因子分解机(OFMHS)。该算法将因子分解机与层次稀疏的特性结合起来去探索有序任务中变量之间的层次稀疏结构。我们通过对目标函数添加相关惩罚项实现二阶特征系数的层次稀疏结构,同时添加有序约束以利用有序信息。实验结果表明OFMHS不仅取得了与当前最优方法可比的分类效果,还能够恢复出特征之间的二阶层次稀疏结构,从而使得模型具有可解释性。2)虽然FM在推荐系统领域已获得了应用,但FM本身并未显式考虑变量的稀疏性。因此,FM的二阶特征结构使其特征选择时应当满足这样一种性质,即涉及同一个特征的线性项和二阶项要么同时被选要么同时不被选,当该特征是噪音时,应当同时不被选,而当该特征是重要变量时,应当同时被选。考虑到这种结构特性,本章提出了一种基于稀疏组Lasso的因子分解机(SGL-FM)算法,通过添加稀疏组Lasso的正则项,不仅实现了组间稀疏,还实现了组内稀疏。从另一个角度看,组内稀疏也相当于对因子分解的维度k进行了控制,使其能根据数据的不同而自适应地调整维度k。实验结果表明,本文提出的方法在保证了相当精度甚至更优精度的情况下,获得了比FM更稀疏的模型。3)FM只能对特征间二阶关系建模。高阶因子分解机(HOFM)能对特征间更高阶关系建模。而且,HOFM应当具有与FM一样的结构稀疏特性:关于同一个特征的线性项和高阶项同时弃选或同时选择。基于此,本文又提出了稀疏化的高阶因子分解机方法并在推荐系统数据集上验证了该方法的有效性。
其他文献
随着国家供给侧改革、乡村振兴战略和普惠金融等战略的深入实施,会泽县农业发展也搭上政策的春风,农民专业合作社蓬勃兴起,目前全县各类农民专业合作社已达679家,家庭农场32
目的:观察清热化湿安肠法治疗小儿秋季腹泻的临床疗效。方法:将200例患者按照随机数字表法分为观察组120例与对照组80例。对照组给予西药常规治疗,观察组在对照组治疗基础上
期刊
<正>积极心理学是美国心理学界正在兴起的一股心理学潮流,它倡导用积极的心态激发人自身内在的积极力量和优秀品质,进而最大限度挖掘人的潜能.[1]当前,学校心理健康教育逐渐
<正>如今的农村有大量剩余劳动力转移到城市,农村留守儿童增多,父母教育的缺失给孩子的成长教育及社会建设带来了极大影响,也给学校的教育教学工作提出了新的挑战。农村留守
近年来,相关研究和改革实践证明了民间借贷在经济增长过程中发挥了特殊作用。本文总结提炼现有关于民间借贷的研究成果,对民间借贷概念、形式、特征及规模,民间借贷存在的原
目的:观察温阳散寒益气通络法治疗类风湿关节炎的临床疗效。方法:80例类风湿关节炎患者随机平均分为治疗组与对照组。对照组给予常规西药治疗,治疗组给予自拟"通阳活络汤"加
<正>伟大的科学家爱因斯坦说过:"兴趣是最好的老师。"如果一个人对某种事物有了浓厚的兴趣,就会主动去探索、研究、实践,并产生愉悦的心理体验,所以要使学生学好数学,必须要
<正>在大多数人眼中,成功人士一般都能言善辩,能说会道,临危不惧,面对大众侃侃而谈。但美国MSNBC网站近日报道,内向害羞大多与生俱来,而且,内向的人在工作中表现更出色,内向
恶性肿瘤是当今世界居民死亡的主要原因之一,随年龄的增长,发病率和死亡率逐渐升高。外科手术、放化疗、靶向治疗等医疗技术的革新一定程度遏制了恶性肿瘤的危害,但仍缺少灵