基于事件序列分析的群体行为建模

来源 :上海交通大学 | 被引量 : 1次 | 上传用户:timhero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
群体行为是指多个个体在某种时空环境下行为的总和。随着科学技术的进步与社会的发展,针对群体行为的分析研究工作越来越受到来自各个领域的研究者的重视,已经逐渐形成了一门基于人类学、社会学、数理统计、计算机科学等学科的交叉学科。如今,借助以传感网、移动互联网为代表的泛在网络技术,我们已经可以采集到大量群体行为相关的数据。这些数据可以帮助我们理解群体行为的目的,描述群体行为的动态,推断影响群体行为的因素,乃至理解群体的分类与发展。这对于社会安全、城市规划、商业投资、生物保育等众多领域都有着重大研究价值和广泛应用前景。为了更好地对群体行为数据进行分析与应用,本文致力于建立基于事件序列分析的群体行为模型,针对以IPTV(Internet Protocol Television)用户观看行为为代表的数据集进行分析建模。根据数据本身的特性,我们分析了实际应用中数据采集和数据分析过程中可能存在的问题,我们重点研究了如下三个问题:1)如何基于事件序列的聚合数据分析群体行为的内部结构?2)如何根据少量有标签的事件序列样本进行事件序列分类?3)如何通过模型同时刻画序列之间的关系以及事件之间的关系?针对上述三个问题,我们采用了不同的方法,建立了相应的模型,并在行为分析与预测、系统仿真等实际问题中得到了良好的应用结果。具体地,本文的主要贡献如下:针对基于聚合数据分析群体行为内部结构的问题,本文提出了一种混合马尔可夫链模型及其基于聚合数据的学习算法,并将其应用于人流估计、轨迹推断、IPTV用户行为分析等问题。本文从状态转移矩阵学习角度分析了基于聚合数据的群体行为传递过程内部结构。通过对状态转移矩阵施加成对稀疏性约束,并指定混合马尔可夫链中每条链对应的活跃状态集合,本文提出了一种混合马尔可夫链模型的基于聚合数据的学习算法,采用交替优化(Alternating Optimization)的方法求解出每条链对应的状态转移矩阵及其在混合马尔可夫过程中的权重。本文重点分析并验证了算法的可行性、复杂度、鲁棒性等性质。实验结果表明,本文提出的混合马尔可夫链模型及其学习算法在人流估计、轨迹推断、IPTV用户行为分析等问题上得到了良好的学习结果。针对根据少量有标签事件序列样本进行事件序列分类的问题,本文提出了基于低秩估计算法的特征提取算法和基于半监督学习的数据分类算法,并将其应用于IPTV系统用户的行为分析问题。本文将IPTV系统用户的观看行为记录数据在低秩假设下聚合成基于直方图表示的行为特征。通过对数据结构进行分析,本文结合快速标签估计算法与非参数估计算法,提出了一种基于图模型的半监督学习分类器,获得了反映用户家庭结构的用户分类结果。该方法不仅可以为大规模人口普查提供辅助信息,同时也为IPTV系统的仿真提供了新的思路。针对对序列关系和事件关系建立联合模型的问题,本文提出了基于点过程(Point Processes)模型的事件序列分析算法。具体的,本文提出了多任务多元Hawkes点过程(Multi-task Multi-dimensional Hawkes Process,MMHP)模型及学习算法,并将其用于对IPTV用户的观看行为进行建模和分析。MMHP模型同时描述了序列内部事件之间的相互激励模式和多个事件序列之间的聚类关系——运用内在强度矩阵(Intrinsic Intensity Matrix)、结构化影响力张量(Infectivity Tensor)和激励核函数对多个序列的动态进行描述。本文提出了一种利用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)、Majorization Minimization(MM)和欧拉-拉格朗日方程(Euler-Lagrange Equations)的迭代算法来学习MMHP模型。在模型学习过程中,本文通过对影响力张量施加稀疏和低秩约束,有效避免了模型学习的过拟合问题,更使得该模型能够同时描述序列的动态过程以及序列之间的聚类关系。该模型的鲁棒性和优越性在基于仿真数据和实际数据的实验中都得到了验证。针对IPTV用户行为分析这一问题,该模型有效地刻画了用户观看行为的偏好以及用户行为随时间变化的特性,同时也得到了良好的用户聚类效果。
其他文献
<正>中国服饰的历史源远流长,从原始社会、商周、春秋战国、秦汉、魏晋南北朝、隋唐、宋辽夏金元、明清,都以鲜明特色为世界所瞩目。原始社会服饰(公元前21世纪之前)战国时人
17世纪以来,祀奉闽南诸府王爷的代天巡狩信仰早已广泛传播在昔日南海诸国,信徒包括各民族。以马来西亚、泰国、印尼、缅甸、越南等地互证,当前各地区王爷信仰兼具国际视野、
以生产建筑陶瓷为主的法库陶瓷工业园具有独特的地缘优势,经过十多年的发展,固定资产投资已经达到20多亿元,年产值70多亿元。近年来出现了产能过剩,库存增加,未来将如何调整
非洲爪蟾(Xenopus laevis)作为两栖类的模式动物,在研究脊椎动物的发育及其相关基因、蛋白质间的调控过程中发挥着重要作用。研究非洲爪蟾晶状体再生以及发育的分子机制已成
近些年来,随着中国综合实力的增强和国际地位的提高,中华文化在世界的影响力在不断扩大。外国人学习汉语及中华文化的热情逐渐高涨,学习需求也更加强烈,对外汉语教学在汉语及
以紫色番茄为原料测定果实中花青素质量分数并优化其提取条件。以花青素质量分数为指标,通过设计单因素和正交试验对影响紫色番茄提取效果的甲醇体积分数、提取时间和提取温
天然气超声速旋流分离技术是用于进行天然气处理的一项新工艺,为了保证其分离效果,必须研究天然气在超声速旋流分离管——Laval喷管中的流动与凝结特性,探索影响喷管凝结性质
统计总体是统计学中一个最基本的概念,各种统计原理教材对它下的定义大致相同;统计总体是由许多性质相同的单位组成的整体。它具有以下特点:(1)总体单位在某一标志的表现上都相同,
随着我国经济的发展,人民生活水平不断提高,不管是对于家庭还是商场、餐厅、办公的环境要求越来越高。而且当前年轻人买房更喜欢购买精装房,拎包入住,这让建筑装修装饰行业快速发展,从而也增加企业间的竞争。公司一般通过垫资的方式使销售业绩增加以增加企业利润,提高公司竞争力。导致大量的工程款实际为应收账款,并且工程通常按照项目合同完工比例分期支付工程款项,验收后仍扣取质保金等特点,导致公司大量资金被占用。A装
信息化时代的到来以及信息技术的不断发展,使得"两化融合"已经成为我国工业化和信息化发展的新一代指导方针和总趋势,在社会经济飞速发展以及市场竞争力越来越大的今天,"两化