论文部分内容阅读
随着信息技术的发展,特别是WEB 2.0的推出及网络电视的普及,越来越多的用户通过互联网来获取信息,并在互联网上发表有关社会、经济、政治等方面的舆论。互联网给人们带来便利的同时也伴随着安全问题,在互联网上,用户能更容易的组成团体,歪曲事实,对一些敏感话题能够起到推波助澜的效果,所以对互联网上的用户行为进行鉴别的分析尤为重要。本文主要研究社会电视中的用户行为,以新浪微博用户及P2P网络电视用户为基础,进行了数据挖掘技术在用户行为分析中的应用研究。主要内容包括:第一,微博用户行为分析。该内容主要包括焦点人物分析和活跃用户行为分析两部分,其中焦点人物分析,主要对网络中粉丝数量众多,在信息转播中起到关键作用的节点用户,进行专门的分析,主要包括焦点人物粉丝地理位置分布分析;关注度分析和基于活跃度的用户分类。另外活跃用户行为分析,主要针对关注某一事件,发帖量和转发量较多的前若干用户,就其发帖量分布、单用户发帖行为和用户网络拓扑结构进行分析。第二,网络电视用户行为分析。该内容主要针对用户在线时长分布、基于在线时长的用户分类、分类用户在线时长演化、用户地理分布可视化和用户到达率等用户行为进行了深入研究。这四个方面的内容都是以PPlive、PPStream和UUSee三个平台的湖南卫视频道的数据为基础展开的,其中用户在线时长分布主要描述了用户观看湖南卫视的持续时间,反映了用户对湖南卫视频道的忠诚度;根据用户在线时长的长短,本文将用户分为三类:轻度收看者、中度收看者和重度收看者;针对三类不同的用户,本文分别进行了用户在线时长的演化分析,反映了24小时内观看湖南卫视频道用户在各个时间点的数量分布;网络电视用户地理位置可视化利用GoogleMap API,将用户节点描绘在地图上;最后本文对用户到达率进行了研究。第三,将微博平台用户行为与P2P TV平台用户行为进行对比分析。主要就用户在线数量、用户在线时长分布、用户在线时间演化和用户地理分布四个方面展开,分析就某一事件,两个网络平台用户行为表现上的异同。