基于数据挖掘的微博用户兴趣群体发现与分类

被引量 : 0次 | 上传用户:dzxxdzc2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博即微型博客,是一种以关注分享为模式的新兴社交媒体,其内容少、发布快、形式多样正好迎合了人们对信息实时的、准确的、多样的分享交流需求,因此受到广大用户的欢迎与喜爱,而微博本身一跃成为当代互联网领域新兴、火热的明星。人们热衷在微博上获取最新资讯,表达自己观点,分享喜爱的事物。用户在使用微博的时候,浏览什么样的内容,关注什么样的好友是根据其兴趣、偏好、习惯来确定的,所以了解用户本身的兴趣就能够了解到用户大概的关注范围与爱好内容,而“物以类聚,人以群分”,对于拥有相同爱好的用户群体的发现有助于为微博推广、微博营销、好友推荐等提供新的切入点与研究思路。但微博用户数量庞大,每个用户都是一个独立的个体,确定什么样的标准,使用什么样的方法,借助什么样的工具去发现用户兴趣群是本文所要解决的问题。数据挖掘方法能够找到海量数据中有潜在价值的知识与模式,所用到的数学算法在经过多年完善修正已经日趋稳定,在金融、电信等领域的应用也有很多的成功案例,而在微博用户兴趣群发现上的应用还没有成熟,本文尝试使用数据分析的方法、借助数据挖掘工具去探索微博用户的习惯、兴趣与偏好,同时也希望拓展数据挖掘应用于微博范围上的研究,以提供新的思路与借鉴。本文以五章的内容尝试探索微博用户兴趣群发现。首先在绪论中阐述了研究微博用户兴趣的重要意义、国内外有关数据挖掘与微博用户兴趣的研究现状与本文的主要内容、研究方法和论文创新点,然后对于数据挖掘概念、流程、方法、算法进行了梳理与探讨,之后提出了基于数据挖掘的微博用户兴趣群体发现的方法与进行聚类分析的数据的标准化方法,最后通过互联网新浪微博上收集的用户数据进行了实证研究,并提出了相应的应用结论与对今后展望。
其他文献
依恋是贯穿一个人一生始终的主题。自从1987年依恋领域扩展到成人以后,有关成人依恋的研究便越来越受到研究者的重视。个体在与重要他人的交互作用中所形成的内部工作模型掌
为关注图示工具在学习中的影响,通过调查图示工具在协作学习情境下的应用,了解影响学习者使用图示工具的主要因素及其作用路径。先基于理论提出假定,再借用技术接受度模型之
区域经济是在一定区域内经济发展的内部因素与外部条件相互作用而产生的生产综合体。区域经济是一种综合性的经济发展的地理概念。它反映区域性的资源开发和利用的现状及其问
要担负起培养建国之才的重任,人民教师必须树造良好的师德师风。应具有高尚人格,树造灵魂的本领;要具有植根于爱,润物无声的技艺;要具有刻骨钻研、严谨笃学的理念;要具有淡泊
为探知适合于青海环湖区青刈燕麦稳产高产的施肥方案进行了三年试验,结果如下:①氮、磷肥配合施用,以每公顷氮素75公斤和P2O511 2.5公斤配合施用产量高,效益佳;②连作和重茬
回顾光伏建筑一体化(BIPV)的工程应用现状,指出影响BIPV关键性技术因素,总结出国内BIPV行业存在标准和规范亟待完善、整合开发不足的技术开发现状。新型建材型光伏构件技术的
知识贫困是制约偏远农村地区自身发展的重要因素,也是成功构建美丽乡村、构建和谐社会不得不跨越的鸿沟。为促进我国偏远农村地区快速发展,构建美丽乡村,构建和谐社会,必须针
众多的学者和专家从不同的角度对国际贸易中的“里昂惕夫悖论”作了大量解释。虽然这些解释对降低悖论的程度起着一定的作用 ,但它们并不能完全排除悖论的存在。本文从次优理
针对现有企业绩效研究主要以静态评价为主的现状,本文采用投影寻踪模型对企业绩效进行时序动态评价。鉴于该模型求解属于复杂的非线性优化问题,传统方法难于直接处理,建立了
目的:分析CCU患者心理问题并研究护理应对措施。方法:分析CCU患者心理问题产生的原因,针对所出现的问题采取相对应的护理措施。结果:针对性的心理护理可解除患者对环境的陌生