【摘 要】
:
在移动互联背景下,智能终端应用的普及使社交媒体迅速发展,一种新兴的媒介形式——短视频,因其信息携带量大,碎片化传播、人性化内容产出形式等特点颇受大众欢迎,移动化的短视频社交媒体快速崛起,并逐渐向各领域扩展,人们的生活方式也随着短视频行业的发展而产生重大变化。随着智能互联网的到来将会促使短视频行业进入更快速的发展阶段。为了适应社会发展的变革,企业从“以产品为中心”向“以用户为中心”变换,通过数据可视
论文部分内容阅读
在移动互联背景下,智能终端应用的普及使社交媒体迅速发展,一种新兴的媒介形式——短视频,因其信息携带量大,碎片化传播、人性化内容产出形式等特点颇受大众欢迎,移动化的短视频社交媒体快速崛起,并逐渐向各领域扩展,人们的生活方式也随着短视频行业的发展而产生重大变化。随着智能互联网的到来将会促使短视频行业进入更快速的发展阶段。为了适应社会发展的变革,企业从“以产品为中心”向“以用户为中心”变换,通过数据可视化手段分析海量用户数据,可以挖掘出有关用户的潜在价值,帮助企业了解现有用户的行为习惯,为用户提供能满足其需求的服务。与此同时,基于数据挖掘技术的用户预测任务,有助于企业挖掘目标用户,从而强化用户对企业的商业价值。所以,数据挖掘技术对于用户研究而言,具有有效的应用价值和现实的指导意义。基于以上背景,运用可视化分析方法和数据挖掘技术,完成用户分析与建模预测任务,首先基于用户数据较为丰富的社交媒体平台——快手,利用Python等工具处理、分析用户属性及行为数据,通过三种用户研究方法,完成用户画像、访问行为及活跃留存等维度的可视化分析,这项工作的目标在于发掘用户的各项特征,制定精准预测策略来辅助决策。其次提取用户注册、登录、视频观看与发布、互动等多个行为特征,建立四种经典的活跃预测模型以评估用户未来一周内活跃状态,并通过加权融合技术提升模型性能2%左右。最后为了简化特征工程,提高模型的有效性,提出一种更实用的迭代优化方法,实证后,模型表现结果提高8%,实现了接近实际应用场景的用户活跃预测任务。本文的研究成果概括为以下几个方面:(1)本研究首先针对目前火热的短视频用户从异常与正常用户在行为上的不同给出相应的解决方法,主要利用了三种用户研究方法,从四个层面可视化分析了用户属性、行为等信息,其中通过多个指标介绍了用户活跃并留存的现实意义,为接下来的实验提供了研究基础。(2)深入上一个研究内容,首先研究了数据挖掘领域浅层的机器学习算法的特点,找到了滑动窗口模型分割数据集的有效方法,并且根据用户行为特点构建了庞大的特征工程,接着经过经典的机器学习算法建模,对比选出四种适合本场景的分类预测器:逻辑回归、决策树、LightGBM和浅层神经网络,并对效果较好的后两种进行加权融合实验,取得了一定的提升效果,但不是很显著,同时也给后续更进一步的研究打下了实验基础。(3)面对传统的用户行为建模过程中复杂且耗时的特征工程任务,很难在实际业务应用中做到准确性和普适性,此外,深入考虑到浅层神经网络模型在时序数据上的的局限性,决定采用门机制的GRU单元改进标准的RNN神经元,在此基础上结合业务需要,提出一个结合余弦降火和热重启技术的迭代优化方法,从而最小化误差,旨在使这个预测模型性能更接近真实的结果。实证在本实验数据集上,取得了较大的突破。
其他文献
随着监控设备数量的增加,视频监控已经逐渐成为维护社会治安和法治的重要工具,也成为智慧城市中协调交通资源的重要支撑。通过现有的视频监控和定位,已经可以越来越多的掌握行人、行车等重要的位置和行为信息,但现有获取信息的数量还仍然跟不上未来万物互联时代庞大的信息需求。比如在漫长的高架桥、偏远的乡村、广阔的海域上,不可能密集布满摄像头装置;又比如在高楼林里的城市里,固定摄像头会被遮挡,留下很多监控的死角。现
传统的地基网络受基础设施、输电线路规模、维护手段的制约,无法部署到环境复杂的地方。因此,为满足高可靠通信的需求,构建一个由卫星网络、临近空间网络以及地面网络组成的空天地网络已成为未来的发展趋势。但相互隔离的网络之间难以实现高效互联互通,随着移动节点的加入,将进一步增加网络复杂化的程度和网络管理的成本,难以满足低时延高可靠通信业务的需求。为应对以上问题,异构网络融合、网络切换等技术被提出来以实现空天
随着社会的发展,软件正发挥越来越重要的作用,软件质量也越来越受到关注。为了能够在软件开发阶段发现软件中存在的缺陷,研究人员尝试使用机器学习预测软件中可能存在的缺陷,然而该技术在应用过程中可能存在冷启动和数据分布差异等问题。为了解决该技术中存在的问题,研究人员提出了跨项目软件缺陷预测方法。跨项目缺陷预测利用一个或者多个源项目的历史数据建立缺陷预测模型,然后对目标项目进行缺陷预测。目前跨项目软件缺陷预
激光混沌系统由于可以输出动力学行为复杂,不可预测,类噪声的高维混沌信号,是安全通信领域的研究热点。激光混沌系统主要分为基于激光器内部非线性效应的全光混沌系统与基于外部非线性反馈环路的电光反馈激光混沌系统。电光反馈激光混沌系统由于鲁棒性强,输出信号带宽宽,有较大的实用性。但是,电光反馈激光混沌通信系统存在安全问题,电光反馈激光混沌系统的动力学方程为延时微分方程,系统会在反馈回路延时的位置处表现出相当
智慧城市作为一项国家战略,已经成为改善公共服务,提升治理能力以及城市转型和现代化的重要切入点。随着智慧城市建设的不断深入发展,对资金的巨大需求给传统以政府主导的智慧城市模式带来重大考验。以PPP模式为契机,智慧城市建设已开始迈向全社会共同参与建设的阶段。由于智慧城市项目的特点是建设周期长,投资大,复杂多样等,加之引入PPP模式,这会给项目的风险管理带来严峻挑战。本文首先阐明研究背景和意义,分析国内
随着云计算和大数据业务的不断发展,人工智能时代下大规模新型业务量的日益增长,给现代数据中心带来了业务复杂化和流量多样化的严峻挑战。作为大数据重要支撑的数据中心,密集型应用的急速增长使得传统数据中心处理计算愈发的力不从心。而分散式数据中心(DDC)光网络架构凭借其高带宽、低能耗以及支持资源灵活调度的优点受到广泛的关注。然而,计算和存储资源分散到不同的资源群组使得网络间通信的流量需求变得多种多样,网络
随着人类社会的发展,人们对外部环境物理量的检测的需求越来越高,各种传感技术应运而生。光纤传感技术凭借抗电磁干扰、环境适应能力强、体积小、结构简单、信噪比高、距离长等优势,成为人们的研究热点。与其他传感技术相比,基于受激布里渊效应的光纤传感技术(BOTDA)凭借着传感距离和信噪比的优势,成为光纤传感技术的一个热门解决方案。本文基于光纤布里渊传感系统,对系统中的控制板和接收板的软件进行了设计,并完成了
非正交多址接入(Non-Orthogonal Multiple Access,NOMA)技术被公认为提高频谱利用率的潜在技术。同时,新兴的无线信息携能传输(Simultaneous Wireless Information and Power Transfer,SWIPT)技术进行信息解码的同时收集能量,在一定程度上延长能量受限无线设备的寿命。考虑用户分布的非均匀性,将虚拟配对(Virtual P
近年来,随着物质生活的日益丰富和互联网的飞速发展,基于活动的社交网络(event-based social network,EBSN)吸引了越来越多的注意力。用户可以在线上结识朋友、加入群组,相约在线下参与实际活动。但是,EBSN中海量的活动让用户目不暇接,带来了严重的信息过载问题。而活动推荐系统正是缓解这种信息过载问题的有效途径。由于活动推荐面临着严重的冷启动问题,因此需要充分挖掘、利用各种上下
基于电子技术的微波波形产生技术虽然已经比较成熟,已广泛应用于卫星通信、仪器测量、雷达探测等领域,但仍然面临着电子系统的速率瓶颈问题,难以满足其应用领域对带宽和频率需求的快速增加。而结合了光子学和微波毫米波技术的微波光子学技术能够产生、处理和传输更高速、更大带宽的信号,有望突破传统电子学的速率瓶颈,为大带宽、高频率波形的产生提供了新的解决方案。基于微波光子的波形产生技术能够产生用户定义的任意波形,例