论文部分内容阅读
随着移动智能设备的广泛使用,无线局域网(Wireless Local Area Network,WLAN)每天面临着成千上万的连接请求,这些数据中隐含着宏观和微观角度下个体的行为模式,对学生行为进行分析和预测在推动智慧校园建设方面起了非常重要的作用,由此催生了基于网络感知系统和学生数据分析的建设和发展,同时推动了从WiFi连接数据中挖掘复杂和具有意义的信息的研究。本文基于已开发的自研平台WiCloud获取北京邮电大学校园内学生的WiFi连接时空数据,并从以下三个方面展开研究:网络感知数据挖掘范式、校园学生行为与学业成绩的关联分析、校园学生移动行为意图预测。1.基于WiFi连接数据的独特性,总结此类数据的挖掘范式。此类数据中包含的终端Mac地址、RSSI信号强度、连接时间戳等信息,它的挖掘范式属于基于不同粒度的对个体活动模式进行描述的过程,主要分为四个步骤。第一步在时间和空间的维度对数据进行形式化描述,明确所定义的时空粒度中不同粒度的转换关系;第二步挖掘个体频繁驻留区域,标记个体对区域的访问的项集;第三步记录个体的相关属性信息,抽取时间特征;第四步形成个体活动序列,然后从中得出知识发现并实验验证。2.基于WiFi连接的网络感知系统(WiCloud系统)收集学生终端访问记录后,将单个个体的连接行为按照一定大小的窗口进行时序上的序列化,得到标记单个个体在一定时间内的行为矢量,然后使用数学函数,将矢量映射为可以量化比较的标量。同时把学生的实际学业成绩映射为标签,结合经典的机器学习分类算法对个体数据和特征进行训练和预测,在横向比较中,线性分类器如逻辑回归和支持向量机的表现优于非线性分类器如GBDT和Naive Bayes,其中Logistic Regression准确率高达0.98,验证计算出的特征对于预测结果即课业成绩有一定预测能力这一结果和该方法的有效性,同时对于学生在校园内的行为预测和分析提供了成本更低、更具解释性的方法。3.把校园场景下个体移动过程建模成马尔科夫决策(Markov Decision Process,MDP)过程,基于强化学习框架,把校园物理环境和学生个体建模成强化学习中的环境,在学生个体移动时触发智能体(Agent)预测学生下一步的动向,由此构成一个决策序列。Agent通过试错方式与环境交互,随着时间推进,在深入理解个体移动行为的意图后学习到一个最优策略,旨在优化智能体(Agent)与环境(Experiment)的多轮交互过程中的长期收益和对学生移动意图预测的准确率。实验表明本文提出的方法对于预测校园内学生移动的意图具有效性,在实验过程取得了稳定的正向收益,实验结果收敛之后的归一化收益恒保持在0.6以上且平均情况下预测准确率大于0.8。