【摘 要】
:
高维度数据通常具有很强的不确定性,主要表现为数据的稀疏和不一致.稀疏就是所获取的数据有缺失,不一致就是数据中有重复或者描述相同而决策不同的数据.考虑到高维数据的这种不确定性特点以及其维数灾难问题,本文分别采用非负矩阵分解算法和粗糙集理论来讨论其维数约简问题,相应地建立了非负矩阵分解新算法和粗糙集预测算法的泛化误差界.详细工作如下:1.提出了基于投影的图正则化非负矩阵分解算法.该算法在非负矩阵分解算
论文部分内容阅读
高维度数据通常具有很强的不确定性,主要表现为数据的稀疏和不一致.稀疏就是所获取的数据有缺失,不一致就是数据中有重复或者描述相同而决策不同的数据.考虑到高维数据的这种不确定性特点以及其维数灾难问题,本文分别采用非负矩阵分解算法和粗糙集理论来讨论其维数约简问题,相应地建立了非负矩阵分解新算法和粗糙集预测算法的泛化误差界.详细工作如下:1.提出了基于投影的图正则化非负矩阵分解算法.该算法在非负矩阵分解算法的目标函数中引入了一个新的正则化子,新正则化子利用投影算子找到了原始数据在低维空间中的表达,并利用流形学习的思想刻画了其局部几何特征.新正则化子建立的假设基础是原始空间中相似的样本在低维空间中依然相似,局部就是只关注样本及其近邻间的相似关系.结合非负矩阵分解算法与新的正则化子,本文构造了新的目标函数,其目标就是希望尽可能的在低维空间中保持样本及其近邻间的相似关系并最小化预测误差.本文利用乘性迭代更新规则和交替迭代更新规则优化了该目标函数,并证明了其收敛性,实验结果表明文中所提算法在预测电影评分上较其他算法表现更优.2.提出了基于相关性和图正则化的增量非负矩阵分解算法.当新加入一个样本时,本文提出的增量算法不但更新新样本的特征,同时也更新与其相关样本的特征.实验表明,相关性的引入提高了算法对缺失值的预测,原因有两方面:一方面是相关性的引入增加了需要重新更新特征表示的样本个数;另一方面是随着新样本的加入,训练集也一直在增加,因为本文所考虑的增量算法在增量过程中,会把新样本加入训练集,当下一次有新样本进来时,上一次加入的样本就会变成一个训练样本,而且有可能会被选作新样本的近邻.3.在序直觉模糊信息系统中,提出了广义优势关系和广义β优势关系及其属性约简.广义优势关系在样本划分过程中只考虑样本所有属性值的综合评价值间的序关系,而不考虑其单个属性值间的序关系;广义β优势关系在广义优势关系的基础上增加了单个属性值间序关系的限制,要求样本间的序关系在综合评价值和单个属性值上同时满足.基于这两种广义优势关系,文中还讨论了序直觉模糊信息系统的属性约简.在大样本多属性决策问题中,广义优势关系和广义β优势关系不会使样本划分的粒太细,从而减小了规则提取过程中信息的损失.4.刻画了粗糙集预测算法的泛化误差界.文中首先利用等价类构造了 一般意义下的粗糙集预测算法,并利用算法的稳定性定量刻画了算法的泛化误差界.结果表明粗糙集预测算法的泛化误差界与样本数和稳定性参数有关,样本越多,稳定性参数越小,其泛化误差界越小,反之亦然.基于该结果,定量度量了置信度算法和最大置信度最小支持度算法的泛化误差界.因为粒化越粗,置信度预测算法的稳定性参数越小,所以当样本数不变时,粒化越粗其泛化误差界就越小,然而经验误差却会增大,此时置信度算法表现出过拟合现象.最后数值验证了文中理论结果.
其他文献
使用中国36家上市银行的面板数据和北京大学数字研究中心构建的省级数字普惠金融指数,研究了金融科技对银行体系稳定性的影响以及影响机制。研究发现:金融科技的发展和应用会对我国银行体系的稳定性产生影响,但存在异质性,其中处于发展前期的中小型及"规模扩张瓶颈期"的商业银行受到金融科技的冲击影响较大;扩大银行体系规模有利于提升银行体系的稳定性;信息效应在金融科技影响银行体系稳定性中存在中介作用。为有效控制金
构建绿色煤炭发展体系是煤炭企业在当前国家大力发展低碳经济保护自然环境背景下诞生的一条新的发展道路,将企业的发展与当下最突出的环境问题结合在一起。目前,相当一部分煤炭企业仍然存在设备陈旧、管理混乱、技术落后等问题,不利于企业向低碳、环保、可持续的道路发展。迫切需要在设备、管理、技术以及观念等方面深入贯彻落实绿色发展理念,实现煤炭企业的绿色低碳发展。
粒子群优化算法是一种基于群体行为的智能优化算法,具有计算简单、易于编程实现、适应性强等特点,适合求解复杂的优化问题,但是容易陷入局部极值,并且算法的性能受到可调参数的影响。目前,对粒子群算法的理论分析工作还不够完善,同时对于粒子群算法的改进工作往往使得算法更加复杂,给其在工程上的应用带来一定困难。本文在粒子群算法的收敛性分析和对算法的改进方面做了一定工作,并将算法应用在分数阶系统的辨识上,主要内容
当今新时代下,经济高速腾飞,科技革新换代迅速,金融科技逐渐占据主导地位。金融科技迅速发展,改变了过往的格局,金融服务的便捷性得到前所未有的提升,对商业银行的竞争环境产生了显著的变革,成为了商业银行面临的最为严峻的挑战。但新的历史机遇将会带来巨大潜力,金融科技成为一把双刃剑,它的飞速发展对于商业银行产生了巨大的影响。本文就金融科技对商业银行经营产生的影响进行讨论,并进一步提出应对的方法对策。
"百分数增减变化幅度"是人教版小学六年级《数学》上册第六单元"百分数"的重难点之一,本课用"增加了百分之几"、"减少了百分之几"、"节约了百分之几"……来表示增加、减少的幅度,这部分教学内容是求一个数是另一个数的百分之几应用题的延伸,实际上是百分数中"一个数比另一个数多(少)百分之几,求百分之几"的问题,它是在"一个数比另一个数多(少)几分之几,求几分之几"的分数应用题的基础上进行教学的。通
金融科技的进步,对商业银行产生了重大影响。面对新形势,商业银行需正视不足,加快转型步伐。本文就金融科技时代下商业银行的发展之路进行简单论述。
《2019年中国共产党党内统计公报》数据显示,截至2019年底,全国党员人数9191.4万名,基层组织数量468.1万个。国家治理的基础在基层,习近平总书记指出,基层工作很重要,基础不牢,地动山摇。新冠疫情的暴发对基层社会治理带来了严峻挑战,直接影响基层社会治理效果的基础党组织建设工作重要性越发凸显;新冠疫情的暴发同时带来了社会行为的变化,网络办公、在线学习等兴起,
近年来,中油阳光物业管理有限公司天津分公司(以下简称"阳光天津公司")在上级党委的支持和领导下,全体员工凝心聚力、共克时艰、脚踏实地、苦干实干,以业主需求为导向,以实现物业的升值保值为目标,不断强化党建引领、智慧赋能,持续加强与客户间的黏性,持续改善服务模式,在危难中勇担使命,在困难中积极作为,呈现出强劲的发展态势,也实现了高质量发展。
银行业与许多行业一样,当前正处于一个重大的变革时代,一定会出现明显的分化,有的银行崛起,有的银行沉沦,这里边最关键的是看这家银行能否顺应科技及数字化的发展潮流。这方面能力强,有预见性,见识早、行动快,就会抢得先机,占据优势;反之就跟不上时代的发展。