【摘 要】
:
随着全球定位技术和基于位置服务的发展,大量文本数据附带了空间位置信息。在地理数据和文本数据的融合变的愈加普遍的情况下,空间文本数据的相关研究成为时空数据挖掘研究领域的热点之一。然而,数据的使用价值随着时间递减,及时获取到的有重要价值的信息对用户的决策有重要的影响,因此越来越多的研究人员开始研究空间文本数据的实时处理算法。空间文本数据的连续查询为本文的主要研究内容。不同于传统的查询,连续查询从注册于
论文部分内容阅读
随着全球定位技术和基于位置服务的发展,大量文本数据附带了空间位置信息。在地理数据和文本数据的融合变的愈加普遍的情况下,空间文本数据的相关研究成为时空数据挖掘研究领域的热点之一。然而,数据的使用价值随着时间递减,及时获取到的有重要价值的信息对用户的决策有重要的影响,因此越来越多的研究人员开始研究空间文本数据的实时处理算法。空间文本数据的连续查询为本文的主要研究内容。不同于传统的查询,连续查询从注册于系统开始到它过期或被用户删除为止,不断检查进入系统的数据对象,并找到满足查询约束的全部对象。现存的空间文本数据流处理系统对连续查询的处理效率有限,且对流式数据中的文本信息变化缺乏调整能力。针对以上问题,对分布式空间范围关键词连续查询算法进行了研究,主要研究内容如下。(1)提出了高效的分布式索引结构和查询算法,有效利用了数据的空间属性和文本属性,在使得总负载代价最小化的同时保证系统的负载均衡性,提升了系统的查询效率,实现了计算资源的高效利用。(2)利用热冷门关键词将数据空间进行了划分,并提出了新的负载代价计算模型,在考虑分区负载平衡的同时,让分区之间的关键词尽可能不相似,划分出更多与查询在地理空间上相交但关键词不相交的分区,减少查询注册的数量,进一步降低系统负载。(3)随着空间文本数据和连续查询请求不断进入系统,系统的负载情况将会逐渐变化。为了保证系统的稳定性,设计了多层级的动态负载调整策略以应对数据流处理环境中负载量的动态变化。系统周期性的检测各个工作节点的负载情况,并对负载异常情况进行相应的自适应调整。(4)在不同的数据集上对所设计系统的性能进行了实验验证。实验结果表明,所设计的分布式空间文本数据流查询处理系统具有高效性和可靠性。
其他文献
防范影子银行风险是防范系统性金融风险的关键。作为影子银行的重要组成部分,资管行业的高速发展,在实现居民财富保值增值、拓展银行新利润渠道的同时,也给金融系统带来了潜在的风险。本文选取双重差分法,使用2016—2019年15家上市银行的季度数据,实证检验了2018年严监管政策——资管新规对银行盈利能力的影响。结果表明:资管新规显著降低了银行的盈利能力;当银行业务更多元,面临更高风险时,资管新规的负面影
随着信息技术的飞速发展,企业的应用数据正经历着爆发式增长。由于团队逐渐庞大,随之而来会遇到诸如数据不一致、读脏数据等数据质量问题。面对多源的数据,传统的数据管理与服务方案如今已难以满足大规模高复杂度的企业应用需求。规则引擎作为通用的策略规则管理框架为解决问题提供了新的思路。已有的技术受限于单体应用架构或特定规则引擎框架,导致其系统耦合度高、规则处理不可定制,难以承受多任务、大吞吐量的应用需求。对此
随着互联网技术和深度学习技术的不断发展,人们越来越关注成本低、灵活性高和性价比高的在线教育,将深度学习应用于在线教育系统也得到了快速发展。客服业务是各大企业和用户交流沟通、获取用户体验、服务用户的重要一环。将基于深度学习的在线教育应用于客服业务将大大提高客服业务的效率,并节省很多成本,所以打造一款在线客服智能教育系统有着重要的作用。设计了一种在线推理算法和离线算法训练相结合的智能评分系统。在线推理
作为信息抽取系统的一个重要环节和基础技术,命名实体识别任务的目标是从非结构化的文本中提取出含有特殊意义或有指代性的词语,其识别结果被用于关系抽取、文本摘要等。对于中文命名实体识别而言,句子的表达是字符接着字符的。尽管一些研究工作在中文分词中取得了成果,但分词误差仍然存在并影响下游模型的识别效率。因此,中文命名实体识别模型通常是基于字级别的,但基于字级别的模型忽略了中文词汇的语义信息,而词汇信息对于
随着移动互联网的飞速发展,网络购物与社交媒体占据了国民生活中的大量闲时流量。大数据时代,为了挖掘用户对商品的偏好,将电商平台的商品数据与用户的社交信息结合可以有效筛选出热点信息,发掘用户潜在的兴趣点并进行针对性的商品推荐。传统的基于内容的推荐系统、协同过滤推荐系统只能通过用户的历史购物记录进行推荐而无法发掘用户潜在的偏好。而基于深度学习的推荐系统又受到机器算力的制约,且无法对推荐结果进行解释。因此
本文运用"相对价格法"研究了汽油、柴油和电力等中国能源市场分割状况及其对中国全要素能源效率的影响。研究表明,中国能源市场分割呈现倒U型曲线,能源调出区市场分割情况更为严重。中国全要素能源效率呈现N型走势,能源调出区全要素能源效率更低,呈现出"能源效率诅咒"。市场分割对全要素能源效率的影响呈现U型曲线,超过97.59%的样本点表明,降低市场分割水平有利于全要素能源效率提高。据此,本文认为,推进能源市
近年来,随着网络的发展和电子商务平台的迅速崛起,线上购物已经成为主流。在消费者深度参与的同时,网络上出现了大量用户评论信息,这些网购评论中往往蕴含大量有价值的信息。通过对这些文本进行情感分析可以得到关于商品的有用建议和反馈,提高购买效率,还可以找到产品问题,改善不到位之处,提高运营效率。情感分析技术由来已久,从最初的基于词典做规则匹配到提取文本特征后基于机器学习算法做分类,再到当下的深度学习技术。
基础建设作为国民经济的支柱需要优先发展,建设大规模、高质量的电力工程是发展基础建设的前提条件。然而,我国电力工程造价管理方式较国际水平落后,制约了国内电力行业的发展。长期以来,电力工程实施过程中产生了大量历史工程数据,其中蕴含了丰富的造价知识。因此,如何从过往电力工程造价案例中挖掘有效信息,改善造价管理过程,成为亟待解决的问题。近几年,工程造价估算一直是研究热点,已有方法能够完成特定领域下工程造价
推荐系统能够结合用户、物品的信息进行信息过滤,高效而准确的定位用户所需要的信息。然而对于不断加入的新用户、新物品而言,推荐系统内部没有充足的交互信息以及描述信息,无法对这部分用户以及物品进行有效推荐,这种现象称之为冷启动问题。近年来深度学习在各个领域取得令人瞩目的成就,不少学者开始尝试结合深度学习的方法来解决冷启动问题。基于深度学习的推荐模型需要充足的数据来支撑模型的构建,然而实际应用场景中用户与
本文基于企业环境规制的微观识别,分析了环境规制对企业技术引进和自主创新两种技术进步方式的影响。研究发现:受到强制性环境规制后,企业技术进步路径会偏向技术引进;从异质性分析看,当受到环境规制时,东部地区企业会偏向技术引进,而中西部地区企业不仅不会增加技术引进,还会降低自主创新,以消极方式应对环境规制;从机制分析看,技术引进能够更好地改善企业环境绩效,稳定其生产规模,但对于企业生产率提升作用不明显;进