基于业务数据的用户行为多层次分析

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:hwen1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的到来,信息技术在人们的日常生活中得到了广泛应用,出现了各种信息系统,记录着用户的日常行为信息。在本文的研究内容中,从用户个人数据分析、用户间关联性度量和用户群体特征分析等三个层次出发,对信息系统的业务数据进行处理和分析,能够多角度的发现业务数据中潜藏的关于用户的知识,更好的为系统运营、用户管理、工作决策提供数据支持:   1)在用电信息采集系统中,由于计量装置异常等原因,会产生多种异常数据。分析数据,诊断导致数据异常的原因,可以提高采集系统的应用效果。本文中,以单个用户业务数据的异常数据特征分析为基础,基于专家经验抽象出异常数据特征集和异常原因集,并建立关联规则知识库描述、挖掘两者间的关系。每条规则包含多个数据特征和一个异常原因,以数据特征为先导,异常原因为后继,定义了规则的支持度和置信度。在此基础上,构建电力数据异常原因诊断系统,使用基于规则的分类算法诊断异常原因,并根据反馈的真实数据修正知识库。系统已在福建全省范围内使用,实现了异常数据的在线监测和自动分析。   2)通过对大量用户的日常轨迹信息的分析,可以发现用户之间的行为关联性,度量用户之间的社会关系强度。本文基于中国科学技术大学的校园卡系统数据特点,提出了一种基于用户行为时间序列模型的社会关系度量方法。该方法首先依据用户的行为数据生成用户行为时间序列,并在此基础上进行行为关联性的度量,以反映用户在真实世界中的社会关系强度,并利用地点访问热度修正社会关系强度的分析结果。实验中使用提出的社会关系度量方法对中国科学技术大学的校园卡系统数据进行分析,度量用户关联性强度,并对方法的有效性进行了验证。   3)通过对校园卡记录的分析,对整个系统用户群体的行为数据,按照地点区域、行为时间进行统计,了解用户群体行为的特征和校园资源的使用情况。此外,结合用户的年级信息等,对本科生用户的早餐就餐的时间、次数与学生所属年级之间的关系进行了讨论。
其他文献
粗糙集理论作为一种处理不精确、不完全和不确定数据的有效数学方法,在许多领域得到了成功地应用,已发展成为一种重要的智能信息处理技术。由于对不精确路径的研究较少,但是实际
复杂场景下行为分析,尤其是稀少行为分析是目前计算机视觉研究领域的基础性课题,由于在该领域研究中需要融合模式识别、人工智能、图像处理等多领域知识,如何有效进行融合,并针对
基于内容的图像检索技术是智能化信息搜索领域研究的重点之一,同时也是图像处理和人工智能相结合的产物,其对数字化信息时代的发展,乃至人们生活方式的改变都起着积极的促进作用
篇章关系分析是自然语言处理的一个核心问题。在篇章研究领域中,篇章是指一系列连续子句、句子或语段构成的语言整体;而篇章关系是指同一篇章中,不同论元之间的语义逻辑关系(如因
随着物联网技术的发展,监控摄像头已广泛的覆盖了我们日常生活中的各个角落,视频目标跟踪技术也被应用于不同的实际监控场景。各种目标跟踪算法蓬勃发展,依据自身跟踪效果被
Mitchell指出,学习是计算机程序通过经验来提高处理某种任务性能行为的一个过程。将学习问题建立在映射空间中进行讨论也是研究机器学习的途径之一。同伦作为研究连续性问题的
无线传感器网络是集多种技术为一体的新型网络,有着广泛的应用和巨大的潜力,近年来也一直是国内外研究的热点。无线传感器网络的节点通常由电池供电,因此网络各层协议在设计时尽
3G移动通信网络作为移动通信技术的代表,能在广域范围内提供较好的漫游服务,但是它提供的数据传输速率以及网络带宽较小,费用较高。WLAN作为另一种常见的无线接入网络,能提供相对
纹理是自然界中物体表面呈现出的主要特征,是人类视觉信息的重要组成部分,对纹理的视觉感知是人类认识世界的重要方式。在研究领域,纹理作为一种图像模式的描述,是计算机视觉和模
虚拟植物是指利用计算机模拟植物在三维空间中的生长发育状况。随着计算机技术与植物学的发展,虚拟植物建模和可视化技术日益成熟,能够逼真地模拟植物生长变化及与环境的交互,并