基于地理信息的检索和用户数据挖掘

被引量 : 0次 | 上传用户:ssl1987310624
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web技术的发展,使得网页中包含了大量的地理信息,挖掘网页中包含的地理信息,将其应用到传统的信息检索领域,有助于搜索引擎更好的理解用户的查询意图,产生个性化的搜索结果。移动互联网技术和基于位置服务LBS(Location-based services)的迅猛发展,催生了新的社交网络。用户在这些新的社交网络中,可以发表自己的看法,实时记录自己参加的活动和活动场所。这就使得通过大量真实的用户数据挖掘用户的活动范围、学习用户行为习惯成为可能,从而可以提供更好地广告服务和个性化推荐。本文主要从以下三个方面对地理信息的应用进行研究:首先,基于文档地名感知的地理信息检索模型,将地理信息应用到传统的信息检索模型中。区别于其它的地理信息检索模型,此模型不使用最小边界矩形确定文档范围,将文档索引在单一的空间索引中,而是将文档按其中出现的地名索引在多个空间范围内,计算单个地名范围与查询范围的相似度,将所有相似度的和作为地理相关性。模型融合时,考虑了地理信息的层次特征和文档的特征。实验表明本文的模型优于传统的检索模型和确定文档地理范围的地理信息检索模型。其次,Twitter中基于用户tweet内容和社会网络的用户位置预测。如果获取到用户经常活动的范围,互联网就可以提供更加个性化的推荐服务。用户在发表tweet时都会有意或无意的泄漏一些地理词(地名或者是方言词汇),并且他们在社交网络中更关注生活在周围的人,本文提出一种融合文本模型与社会网络模型的混合概率模型来预测用户的位置。在文本模型中,提出两种识别地理词的方法,反位置频率和偏远位置过滤,同时也考虑了命名实体识别这种传统的地理词识别方法;在社会网络模型中本文考虑了用户粉丝(或者是关注)的网络关系。实验结果证明本文的方法预测效果要好于之前的方法。最后,LBS中基于用户兴趣和时间的位置推荐。LBS中用户海量的签到数据,为学习用户的行为习惯、兴趣爱好和位置的特征提供了便捷条件,从而可以更好的为用户其推荐感兴趣的和合适的场所。本文提出一种推荐模型,它考虑了用户的访问时间、位置的时间特征和流行度、用户的兴趣、用户朋友的影响和用户所在位置等信息。在签到数据集进行的实验表明,融合时间和用户兴趣的推荐确实能提高推荐的效果。
其他文献
目的 :观察氢氧化钙糊剂治疗急性根尖周炎及慢性根尖周炎急性发作过程中对疼痛的影响。方法 :门诊就诊的急性根尖周炎或慢性根尖周炎急性发作患者 84例 ,随机数字法分为两组
钢管混凝土叠合柱结构,是我国自主开发的一种结构体系,其较钢筋混凝土柱和型钢混凝土柱具有更优良的抗压和抗震性能,具有更好的经济、社会效益。当前国内外抗震设计的发展趋
随着中国经济的腾飞、综合国力的不断提升,身处全球最大新兴市场的中国消费者的态度和行为已成为中国本土企业和跨国公司共同关注的焦点。企业社会责任(Corporate Social Res
肝脏疾病是人类最常见的疾病之一,严重威胁着人类健康。为此,研发抗肝脏疾病的有效药物显得尤为重要。动物实验是药物进入临床的必经之路,在研发抗肝脏疾病药物过程中,选择有科学
按照传统的商标侵权理论,只有在相同或者相似的商品或服务上使用相同或者相似的商标,才会造成混淆,导致商标侵权的发生。但是随着全球经济一体化程度的不断加深,出现了不同于
文章站在企业管理者的角度,吸收现代人力资源管理先进经验,从公平意识、倾听技巧和沟通方式三方面,阐述了通过科学人力资源管理增强对员工的凝聚力,使其充分发挥主动性和创造
日新月异的经济与科技的快速发展,使信息时代加快了社会的进程,从而给人们的生活带来革命性的变化。人们的消费观念也由着眼于发挥商品物质效能的传统消费观转变为注重满足人
随着经济全球化的进一步发展,我国航空运输不论在国内还是国际上都开始承担起越来越重要的责任,而航空运输基础设施的质量就成为履行该责任的重要保障。QG公司是东北空管局的
文章先通过对微分方程的解的存在性和惟一性的证明,再通过对解的延拓和连续性的论述,引出方程的稳定性的讨论,初步探讨了线性和非线性微分方程的稳定性,重点对非线性微分方程
20世纪末,我国有专家学者提出废除贪污贿赂犯罪死刑,自此之后,贪污贿赂犯罪的死刑存废问题一跃成为我国的刑法热点问题,贪污贿赂犯罪死刑是否应当废除陷入争论的漩涡。2011年