异构大数据环境中高效率知识融合方法的研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:wtwl66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识融合是知识图谱技术的关键环节,而传统机器学习算法较难满足异构大数据环境中知识融合的准确性及实时性需求.提出一种结合概念漂移检测算法与无监督反向验证算法的高可靠、低复杂度知识融合方法.该方法利用贝叶斯估计进行实体对齐与属性融合的同时,周期性进行基于孤立深林算法的概念漂移检测与基于自组织映射网络的反向实体消歧,以此有效互补监督学习的样本依赖性及无监督学习的高复杂度特性,从而提高知识融合的可靠性与实时性.提出算法在公开数据集与国网安徽省电力公司知识图谱数据库中分别进行了数据实验,通过对数据模型可靠性、实体对齐能力、F1分数和运行时间的比较,分析了提出算法在多维、异构大数据环境的应用可行性.
其他文献
针对大数据背景下随机森林算法中存在协方差矩阵规模较大、子空间特征信息覆盖不足和节点通信开销大的问题,提出了基于PCA和子空间分层选择的并行随机森林算法PLA-PRF(PCA and subspace layer sampling on parallel random forest algorithm).对初始特征集,提出了基于PCA的矩阵分解策略(matrix factorization strategy,MFS),压缩原始特征集,提取主成分特征,解决特征变换过程中协方差矩阵规模较大的问题;基于主成分特征
语法纠错(grammatical error correction,GEC)是自然语言处理领域的重要应用之一,在近几年取得了较大的进展和丰富的研究成果.对语法纠错研究进行了深入调研,旨在更好地了解当前的研究进展、面对的挑战和未来发展趋势.介绍了语法纠错的基本含义和研究概况,分析了语法纠错领域的重要研究进展,对数据处理方法、算法模型和GEC评估方法等关键方法分别做了探讨,并概括了中文语法纠错的研究状况.总结了语法纠错研究的相关资源,主要包括文献资源、开源应用和公开数据,并讨论了GEC面临的问题和挑战.
传统推荐算法大多使用用户评分数据来推测用户偏好,仅用评分数据会导致推荐结果单一,缺乏多样性和个性化,同时评分数据还普遍存在严重的稀疏性问题.针对上述问题,提出了一种基于情境信息迁移的因子分解机推荐算法.根据情境信息对数据集进行划分,利用自适应增强方法对不同情境下的数据样本进行迁移处理,将处理后的数据集放入因子分解机,实现评分预测.实验结果表明该算法能在充分使用数据样本、缓解稀疏性问题同时,进行更准确的个性化推荐,相较于传统推荐算法推荐误差降低了2.05%.
为了解决车辆端计算能力不足、任务处理时延大、能源消耗多、无线资源缺乏等问题,该文考虑利用非正交多址技术进行任务上传和数据包下载的车辆边缘计算系统,对系统的卸载决策、缓存决策、计算和缓存资源的分配进行联合优化.由于车辆需要在动态网络环境下实时确定任务卸载和缓存策略,提出了一个以移动边缘计算服务器平均能耗最小化为目标的随机优化问题,以获得最佳性能.利用李雅普诺夫优化理论,构建惩罚漂移函数后将其解耦为两个独立的子问题,采用0-1规划和线性规划求出问题的最优解.仿真结果表明,与传统正交多址接入方案相比,基于非正交
为研究多社团网络级联失效问题,设计一种社团规模和结构可调的网络模型.在经典的线性负载-容量模型基础上,提出一种初始负载、容忍负载、临界负载三个阶段节点失效模型.采取蓄意攻击和随机攻击方式对网络进行攻击,通过评估指标的变化分析网络的鲁棒性.仿真结果表明:随机攻击时多社团网络鲁棒,蓄意攻击时多社团网络脆弱;节点初始负载越低,网络越鲁棒;社团内节点连接越均匀,社团间连接初始负载越低的节点,网络越鲁棒;给头节点附加二次容忍负载和将级联失效限制在一个社团内,网络越脆弱,容易引起网络级联失效.
针对采用传统梯度下降算法训练卷积神经网络收敛速度慢的问题,提出了动量分数阶梯度下降算法.介绍了分数阶微积分的定义,并依据问题描述,通过算法推导,将整数阶梯度下降算法中的动量思想应用到分数阶梯度下降算法中,设计出动量分数阶梯度下降算法.使用测试函数验证算法的收敛性,并分析不同分数阶阶次和动量项系数对算法收敛性的影响.在三个数据集上使用动量分数阶梯度下降算法与传统梯度下降算法、动量梯度下降算法作对比实验,实验数据表明,动量分数阶梯度下降算法可以在不同复杂程度的数据集上,在保证较高分类准确率的前提下,极大提高卷
当今时代,经济的快速发展越来越值得关注,中小企业逐步被重视起来,推动着经济的健康快速发展,同时,对于提高企业的财政收入起很大的促进作用.尽管如此,中小企业依旧在激烈的竞争中暴露出许多问题,随着企业规模的进一步扩大,越来越不能够高度重视企业的财务经营风险,许多企业所采取的策略都很有可能会直接导致融资的风险.本文将以中小企业为例,分析中小企业在生产和经营过程中可能面临的一些风险,针对性的提出建议,改善公司的运营,从而合理地有效规避中小企业的资产投资和经营流动性管理风险.
实现人的自由而全面发展是马克思主义的终极追求,更加是未来自由王国中人的“应然”状态.人工智能的快速发展及其在社会生产生活中的广泛应用,为人类的劳动解放创造了有利条件,即创造性劳动内化为人的发展需要,实现对异化劳动的超越,获得人与人之间社会关系的实质化和丰富化,以及人的深层次需要的满足,进而为自由时间的有效使用、人的自由而全面发展提供了新的可能性.善用人工智能以发挥人工智能在生产生活上的优势,发挥其创造物质文明和精神文明的潜力,实现对人工智能的积极扬弃.
目的 探讨不同术式治疗复发性翼状胬肉的临床效果及利弊.方法 选取2018年3月至2020年9月于我院手术治疗的126例复发性翼状胬肉患者,以随机抽样法分为3组,每组42例,对照组采用翼状胬肉切除+自体结膜瓣移植术,观察组分翼状胬肉切除+结膜带角膜缘干细胞移植术,翼状胬肉切除+瑞济无滤纸型生物羊膜移植术.结果 对照组一年后再次复发率为14.3%,翼状胬肉切除联合结膜带角膜缘干细胞移植术复发率为4.8%,翼状胬肉切除联合生物羊膜移植术复发率为7.1%,对照组与后两组间有统计学差异,后两组无明显差异,但翼状胬肉
近年来,深度学习技术广泛应用于侧信道攻击(side channel attack,SCA)领域.针对在基于深度学习的侧信道攻击中训练集数量不足的问题,提出了一种用于侧信道攻击的功耗轨迹扩充技术,使用条件生成对抗网络(conditional generate against network,CGAN)实现对原始功耗轨迹的扩充,并使用深度神经网络进行侧信道攻击.通过选择密码运算中间值的汉明重量(hamming weight,HW)作为CGAN的约束条件,将CGAN生成模拟功耗轨迹作为多层感知器(multi-l