采用数据血缘的数据热度预测方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:goodsky4008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据之间存在相互引用关系,在进行数据开发时,通常存在一些具有高热度的数据,此类数据被其他数据大量引用,它们的缺陷往往会给整个大数据平台产出的数据结果带来极大影响。因此,对高热度数据进行预测并予以相应保护至关重要。面向基于数据热度的数据分级治理需求,提出一种采用数据血缘的数据热度预测方法。首先通过构建数据系统中的数据血缘捕获数据节点之间的引用关系;然后,提取数据血缘的时间和结构特征,并采用图卷积网络(GCN)进行数据血缘图特征的学习;最后,提出一种数据血缘传播趋势分层读出的方法读出图特征,对数据热度进行预测。在浙江中烟营销系统数据集ZJZY-SL和高能物理现象学相关论文引文数据集(HEP-PH)上的实验结果表明,相较于DeepCCP等方法,所提方法的识别准确率分别提升7.64、2.88个百分点,平均F1分别提升4.7、4.34个百分点。所提方法能充分挖掘数据在被引用早期的数据血缘特征,并预测数据节点未来的热度。
其他文献
伴随着经济社会和城乡一体化的快速发展,大量的固体废物制约着城市的可持续发展。"生产量大、消费量大、废物量大"的传统经济发展模式与当下"创新、协调、绿色、开放、共享"的先进发展理念已不相适应,建设"无废城市"势在必行。文章通过分析"无废城市"的国际发展历程和建设"无废城市"的重大意义,结合我国现实背景,提出了对无废城市建设的几点思考。
期刊
报纸
期刊
<正>在数字经济时代,数据被誉为价值连城的“新黄金”。今年3月,党的二十届二中全会通过了《党和国家机构改革方案》,提出组建国家数据局,这一举措将打造出“数据化国家队”,必将推动数据“新黄金”更加充分地实现数据要素价值,促进全民共享数字经济发展红利。数据要素作为全新的生产要素,已经成为商业银行业务发展的内生增长力,科学的数据治理机制和治理模式是发挥数据要素价值的基石。
期刊
<正>1946年1月,《上海文化》月刊在大中学生及职业知识青年中进行了"你最钦佩的一位作家"的读者调查。结果令人大为惊讶,"东吴系女作家"的领军人物施济美竟然紧追大作家巴金、郑振铎和茅盾之后,名列第四,把叱咤上海文坛的张爱玲、苏青和潘柳黛等抛在了后面。
期刊
<正>工程建设是手段,管护是关键,最大限度发挥工程效益才是目的。为了管好用好已建高标准农田基础设施,尉氏县依托县乡村综合管理平台,探索实行三级网格化管理,同时积极推行井长、林长、路长、河长和田长"五长制",进一步落实管护责任,取得了较好的管护效果。
期刊
针对现有的Transformer预测时序模型中受异常值的影响、难以捕捉长期依赖关系的问题,对传统的Transformer模型进行了改进,在Transformer模型中增加了新的注意力模块,并进行了时序卷积操作。实验表明,新的模型较原来的Transformer模型及一些在时序预测领域的先进模型具有更低的预测误差,可以在多个实际应用领域展现出良好的效果。
期刊
视觉目标跟踪是在给定目标初始信息的情况下,建立目标跟踪模型对目标运动状态进行预测。梳理深度学习下现存的目标跟踪算法,从基于卷积神经网络方法、基于循环神经网络方法、基于生成对抗网络方法和基于孪生网络的方法几个方面,对基于深度学习的目标跟踪算法进行综述;总结了目前代表性的数据集;展望了视觉目标跟踪技术的发展趋势。
期刊
目的探讨替罗非班对急性缺血性脑卒中(AIS)血管内治疗患者神经功能及术后出血转化的影响。方法我院收治的120例AIS患者,根据是否应用替罗非班分为对照组58例和观察组62例,对照组给予静脉溶栓桥接血管内治疗,观察组在对照组基础上加用替罗非班治疗,比较两组治疗14 d的神经功能[美国国立卫生研究院卒中量表(NIHSS)]、血小板功能指标(血小板聚集率、血小板黏附率及P-选择素)和炎症指标[超敏C反应
期刊
<正>最近,我新发现了三则有关建国初期施济美文学活动的史料。施济美在建国后的文学活动资料极为少见,这三则史料能粗浅地勾勒出施济美在这一时期的些许文学踪迹。在现代文坛上,施济美曾以《凤仪园》、《鬼月》等小说名闻一时,那时有人公开称自己为"施迷"①,但是建国后她渐渐湮没无闻。近几年来,随着东吴女作家日渐为部分研究者所关注,作为其中坚力量的施济美也引起人们的瞩目。然而很少有
期刊