【摘 要】
:
微博作为Web2.0时代新生的网络应用形式,自诞生不久就以其惊人的影响力和急速攀升的用户数量在互联网业界引发了一场前所未有的“微革命”。与其他社交网络不同的是,微博不仅
论文部分内容阅读
微博作为Web2.0时代新生的网络应用形式,自诞生不久就以其惊人的影响力和急速攀升的用户数量在互联网业界引发了一场前所未有的“微革命”。与其他社交网络不同的是,微博不仅仅是一个沟通交流和信息传播的媒介,其惊人的消息扩散能力在广告营销和个性化服务方面也具有广阔的应用前景。精准的广告投放及好友推荐在加强微博用户的体验、提高用户满意度的同时,也为微博网站带来巨大的利润收益,因此对微博用户兴趣的挖掘及应用是一个非常值得关注的研究方向。本课题以新浪微博为研究对象,针对目前微博网站对用户兴趣挖掘不够准确的问题,本文提出了一种基于行为的微博用户兴趣挖掘方法。该方法首先研究了微博网站的特性及微博用户行为特点,重点分析了用户的关注行为、发布微博行为、评论转发及加用户标签的行为,并通过数据统计分析筛选出代表用户兴趣的行为信息。然后构造用户兴趣类别分类器,对代表用户兴趣的行为信息进行兴趣挖掘,并利用调和因子对不同行为的挖掘结果进行融合,进而得到本文提出的基于行为的微博用户兴趣挖掘方法。最后,制定可行的用户兴趣挖掘方法的评价标准及验证方案,利用新浪微博开放平台提供的API接口进行实验数据获取,并与实际微博用户兴趣模型进行对比,在可行性、准确性及灵敏度方面进行实验验证,结果表明,本文提出的基于行为的微博用户兴趣挖掘方法具有可行性,挖掘结果较准确,且对用户兴趣漂移现象反应较灵敏。
其他文献
20世纪90年代以来,生命科学研究取得了突破性的进展,随着人类基因组计划的开展与现代生物技术的发展,人类积累的大量的生物信息数据为揭开生命奥秘提供了数据基础。而怎样从
随着计算机技术的发展,软件和软件系统在生产生活中的应用越来越广泛。除了微型计算机中的应用软件外,在工业制造、交通运输乃至军事领域中也拥有了规模庞大的软件系统。在大型
挖掘关联规则及规则的更新是数据挖掘领域的一个重要研究热点之一。目前已经提出了许多用于高效地发现大规模数据库中关联规则的算法,这些算法都有各自的特点。基于不同的关联
可重构计算系统利用可编程逻辑器件可重配置的特点,在通用微处理器和专用集成电路之间提供一个结合功能灵活性和高运算速度的平台,被认为是能满足未来嵌入式应用市场需求的一
互联网的发展和信息技术的进步,带来了信息量的猛增,人们很难在浩瀚的信息中找到真正需要的信息,虽然各种搜索引擎的出现在一定程度上解决了这一问题,但是各种搜索引擎都是简
我国的电子政务经过20多年的发展,得到了前所未有的发展。但仍然存在很多问题,如不同政府部门之间共享信息资源面临重复采集,数据命名、格式差异,部门间的数据不一致,技术多
电力行业在国民经济中占有重要的地位,随着电力系统的发展,越来越密织的电网,复杂的电力设备,使得电力行业的数据变得日益庞大且难于管理。如何将这些数据直观的显示在地图上,如何
目前,无线局域网大部分是基于IEEE802.11标准的,但是许多研究表明IEEE802.11标准存在诸如缺乏双向认证、存在弱密钥等安全问题。IEEE802.1x针对当前无线局域网出现的安全问题
随着Internet/Intranet快速发展,网络安全技术日益受到人们的重视。PKI(Public Key Infrastructure)是目前较为成熟的网络安全解决方案,它能够保障网络上各种应用的机密性、