论文部分内容阅读
随着信息系统的普及,人们在生活中产生了大量隐式用户行为数据,与显式用户行为数据不同,隐式用户行为数据并非用户有意产生,而是在日常生活中为达到其他目的的过程中无意产生的,例如:在投票中做出决策、购物、借阅图书等。隐式用户行为数据可以从侧面反映出:个人的行为特点、生活轨迹、兴趣爱好,群体的活动规律等潜在信息。本文中,我们利用中国科学技术大学(下文简称“中科大”)部分同学在可控社交网络网络实验上的行为数据、2011年与2014年一卡通刷卡数据、图书馆借阅、校园网邮箱、微博和人人网等数据集完成了下列工作:1.社交网络上投票行为实验分析本部分介绍了利用可控社交网络实验中的隐式用户行为数据挖掘网络结构、激励机制和社会现象对“投票”这一社会活动的影响的工作。从实验结果中分析了个人行为的固执性等特点。2.利用学生校内外行为数据生成“体检报告”系统设计与实现该系统实现了利用校内外多个来源的隐式用户行为数据挖掘中科大学生的生活规律,并针对作息不规律的同学提出改进建议的功能。本部分首先介绍了我们定义睡眠、吃饭时段的规则和生成体检报告的算法。然后详细描述了该系统的实现,其中包括了系统架构、数据爬虫、与用户交互的CakePHP网站搭建。同时对部署该系统的微软云计算平台Windows Azure的架构和特点进行了简单介绍。3.利用一卡通数据预警食堂突发事件和学生非正常离校情况本部分研究了利用中科大校园卡刷卡数据分析食堂营业额和学生日常刷卡规律。使用营业额的历史数据、学生历史刷卡次数数据构建时间序列预测模型,用来预警食堂突发事件和学生非正常离校情况。在“研究基础”部分,我们介绍了三次指数平滑算法及其演进过程、Box-Jenkins算法及ARIMA模型。在“实验分析”部分,我们通过对刷卡数据的可视化,证明了其符合上述模型的平稳性和周期性要求,并介绍了我们模型拟合的结果和预测案例分析。