论文部分内容阅读
随着信息化时代的到来,信息技术在人们的日常生活中得到了广泛应用,出现了各种信息系统,记录着用户的日常行为信息。在本文的研究内容中,从用户个人数据分析、用户间关联性度量和用户群体特征分析等三个层次出发,对信息系统的业务数据进行处理和分析,能够多角度的发现业务数据中潜藏的关于用户的知识,更好的为系统运营、用户管理、工作决策提供数据支持:
1)在用电信息采集系统中,由于计量装置异常等原因,会产生多种异常数据。分析数据,诊断导致数据异常的原因,可以提高采集系统的应用效果。本文中,以单个用户业务数据的异常数据特征分析为基础,基于专家经验抽象出异常数据特征集和异常原因集,并建立关联规则知识库描述、挖掘两者间的关系。每条规则包含多个数据特征和一个异常原因,以数据特征为先导,异常原因为后继,定义了规则的支持度和置信度。在此基础上,构建电力数据异常原因诊断系统,使用基于规则的分类算法诊断异常原因,并根据反馈的真实数据修正知识库。系统已在福建全省范围内使用,实现了异常数据的在线监测和自动分析。
2)通过对大量用户的日常轨迹信息的分析,可以发现用户之间的行为关联性,度量用户之间的社会关系强度。本文基于中国科学技术大学的校园卡系统数据特点,提出了一种基于用户行为时间序列模型的社会关系度量方法。该方法首先依据用户的行为数据生成用户行为时间序列,并在此基础上进行行为关联性的度量,以反映用户在真实世界中的社会关系强度,并利用地点访问热度修正社会关系强度的分析结果。实验中使用提出的社会关系度量方法对中国科学技术大学的校园卡系统数据进行分析,度量用户关联性强度,并对方法的有效性进行了验证。
3)通过对校园卡记录的分析,对整个系统用户群体的行为数据,按照地点区域、行为时间进行统计,了解用户群体行为的特征和校园资源的使用情况。此外,结合用户的年级信息等,对本科生用户的早餐就餐的时间、次数与学生所属年级之间的关系进行了讨论。