论文部分内容阅读
智能手机(Smartphone)作为主要的智能移动终端设备,已经成为人们日常生活不可或缺的一部分。凭借其强大的功能,目前智能手机已经占据了手机市场的绝大部分份额。智能手机不同于传统手机,搭载着智能操作系统,内嵌了数量不等、功能各异的传感器。特别是,智能手机还支持自行安装和卸载第三方应用程序(APP)。这些功能丰富、用户界面良好的APP成为智能手机吸引用户的重要因素之一。因此,APP开发商时刻关注用户对不同APP的需求,同时也通过不同渠道捕获这些需求的变化及其趋势,以便给提供最符合用户需求的便捷服务。因此,APP的数量和类型处在日渐丰富的过程中。APP的使用已经融入到用户的日常生活,从网络学习、在线购物、点名签到、办公交互,到新闻浏览、休闲娱乐等无不存在,用户的这些行为将以APP日志的形式记录了下来。因为APP日志是用户行为的真实记录,对个人的历史APP日志做挖掘与分析,便可提取出数据背后隐含的行为模式及性格偏好的个人行为信息。以用户行为模式的挖掘和用户偏好的提取为目标,本文研究APP日志数据的挖掘和分析,具体如下:1)智能手机APP日志的采集本文基于Android平台,首先,开发APP状态数据收集工具。用以收集用户使用APP的开始时间、持续时间与APP的包名。此方面内容研究基于智能手机使用情况的用户行为捕获与分析,手机APP的使用情况一定程度上反映了用户的使用习惯和行为,累积的大量历史APP日志数据是用户使用情况的真实记录,是用户行为模式挖掘和提取的重要信息来源。为此,本文研究了APP使用数据的连续收集。2)APP日志数据的预处理与形式化将获取的APP使用数据进行预处理跟形式化。APP日志是APP运行状态的记录,记录了用户对该应用的使用情况。基于APP日志挖掘用户的使用模式时,需要滤除原始APP日志中那些持续时间很短的APP运行记录和不能反映用户使用情况的桌面运行记录,同时填补由于设备或程序故障导致的APP运行的缺失记录。形式化是将预处理后的APP使用数据表示带有时间标签的三元组,以形成APP事务集。3)APP事务关联规则提取与发现利用经典的数据挖掘算法Apriori,对所收集到的APP使用数据进行关联规则挖掘,得到用户频繁使用的APP之间的关联,以分析用户使用智能手机的行为习惯、兴趣爱好及性格特点等。APP事务之间的关联反映了它们的并发,APP事务的关联规则是用户行为模式的体现,为提醒和推荐等服务的实现提供了技术实现基础。4)APP日志挖掘系统的设计与实现基于提出的前述算法和技术,运用先进的软件工程思想、理论和方法,设计并实现向用户行为模式提取的轻量级APP日志挖掘系统。同时,用在真实应用场景对系统进行测试。综合个人APP使用的全部历史数据,应用合理的数据挖掘技术,发现和识别隐藏在APP数据中的用户生活习惯、兴趣爱好、学习状况、职业种类及消费水平等的个性化行为,以便提供个性化建议和提醒,在提升用户的使用体验的同时减轻或消除手机使用带来的负面影响,有着重要研究意义和应用价值。