基于改进DBSCAN算法和K-S检验的收视数据集异常检测方法

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:hhzzmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
收视率反映了节目的受欢迎程度,是节目编排和广告投放的关键参考指标,对于视听生态有着重要的经济和社会影响。低收视率时代,主观或客观原因导致的少量抽样样本数据污染,即可对收视率结果带来颠覆性变化。因此,收视率的可信性备受质疑。近年来,随着广电行业大数据技术的发展和应用,使得通过全量收视数据进行精准收视率的计算成为可能。然而,虽然在国家级层面实现了收视率计算环节的可信,仍然无法消除视听运营商数据源头污染的可能性。论文针对收视数据运营商侧源端可信性问题,提出了一种抽样数据集与上报数据集比对的源端数据异常检测方法。首先,论文提出了源端数据异常检测总体框架。通过数据探针的方式,在运营商侧随机、抽样形成一个大数据化的抽样数据集,对抽样数据集和运营商上报数据集进行数据清洗和预处理,得到用户在某时间域上的收视行为的规范化表示。在聚类维度和统计维度两个方面,对两个数据集进行分析,判断出数据集的差异情况。其次,在聚类维度,提出了 KNNP-DBSCAN算法,解决了传统DBSCAN算法选取参数困难和时间效率低的问题。KNNP-DBSCAN算法能够自动确定最优参数,并且基于网格划分实现了并行化改进。通过在常用的人工数据集上和收视数据集上进行实验和仿真,证明了本论文算法能够保证聚类效果的稳定性,具有较明显的性能优势。第三,在统计维度,分别进行标准统计分析和分布统计分析,在标准统计方面从数据集的总体状况评估数据集的差异程度,计算期望值、标准差、偏度以及峰度。在分布统计分析方面,针对收视数据集的分布和采集特点,提出基于固定间隔和权重函数的改进双样本K-S检验方法,对数据样本进行离散化表示,经过实验表明该方法在收视数据集上具有较高的功效性,可以用于判断两个数据集的分布性差异情况。最后,通过在收视数据集上的实验,验证了论文提出的收视数据集异常检测方法的有效性。
其他文献
在当前社会经济发展下,大数据时代已然到来,随之而来的就是对于各个行业的机遇与挑战和人们对与大数据相关联的技术的高要求.本文针对计算机信息处理这一视角进行研究,希望在本文的分析之下帮助人们认识到大数据时代的计算机信息处理技术的一个初步概念,从而对相关技术实现进一步发展.
近些年,基于信息技术的进步,促使我国进入了新媒体时代,在这一背景下,就传统媒体而言,不但面临着非常多的挑战,也将获得更多的机遇.对此,文章基于新媒体环境,针对新闻编辑多样性进行了分析,首先探讨了多样性发展的意义,在此基础上提出了有关的发展建议,包括增加新闻编辑形式,开展多样化编辑,推动编辑排版多样化,补充新闻编辑平台,希望可以促进新闻编辑多样性,为相关人士提供参考.
1. 四川理塘乡村文旅发展困境rn1.1 理塘文旅探索rn2017年党的十九大报告首次提出了乡村振兴战略,发展乡村旅游业是实施乡村振兴的重要内容.将乡村旅游资源与乡村文化资源有机结合进一步赋予了乡村旅游更多的内涵与意义,乡村文旅融合为乡村振兴提供了可持续发展的源泉,已经成为许多贫困地区脱贫致富的有效道路.
期刊
新媒体在迅猛的发展,使我国的传统广播电视行业受到冲击,许多广播电视台处于前所未有的发展的困境中.广播电视想要在困境当中有所突破,在激烈的市场竞争当中拥有自己的立足之位,长久的发展下去,广播电视就必须进行转型,适应时代的发展,迎接时代的挑战.做好广播电视台与新媒体的融合,让广播电视拥有更好的发展前景.
新闻的情感信息对于金融领域具有重要参考价值,短新闻内容精炼,尤其是新闻快讯更能够反映重大的新闻。随着短新闻的传播载体从纸媒到互联网的改变,金融领域开始尝试将其情感信息以计算机可以理解的形式提供给具体业务场景使用。但目前缺乏金融新闻情感分析的数据集,从而缺乏相应的情感自动标注方法,而且现有的提供新闻情感信息的产品不能满足本系统的需求。因此需要构建系统,标注金融短新闻的情感信息,辅助金融短新闻分析员进
融媒体时代的到来给传统的电视新闻节目带来了新的发展机遇,信息技术以及网络化的发展提高了电视新闻节目质量,同时也对传统新闻媒体的发展起到了一定制约作用.在这样的环境下,新媒体和传统媒体逐步实现了融合,进而推动了双方的发展,使新闻媒体行业呈现出一片繁荣的景象.融媒体的诞生,给予了电视新闻行业发展机会,也带来了危机,本文就融媒体时代下如何进行电视新闻节目传播展开讨论,旨在探寻融媒体电视新闻节目的有效传播策略,促进我国传统新闻行业的改革与创新.
近年来,我国的科学技术水平有了很大的提升,计算机互联网已经广泛运用到人们的生产和生活中,促进各行各业不断实现变革的同时,更提升了人们的生产生活效率.其中,在广播电视信号中,随着计算机技术的运用,其在信号监控上已经全面实现自动化,转变了传统人工操作的局限性,有利于工作效率的不断提升.
随着信息化时代的到来,信息传播的方式呈现出多渠道、多样化的特点.传统的新闻传播渠道较为单一,就会极大的受到新媒体带来的冲击.所以,电视记者编辑要与新媒体时代特征进行有效的结合,注重对于个人编辑业务素养的提升,最终实现对新闻节目的全面优化,使节目的竞争力大幅提高.这样新闻节目能够有更多的受众群体,其公信力也会更好.电视记者编辑还要采用多样化的传播渠道,节目内容也要根据当下人们的需求进行调整,这样才能使新闻在众多的节目中脱颖而出.本文主要分析了新媒体时代下,记者编辑业务素养如何提升的问题,希望能够帮助大家.
融媒体时代的到来,也说明了科学技术逐渐的发展,这也对电视时政新闻传播带来极大的冲击,如何才能保证电视时政新闻传播时所具备的吸引力得到提升,已经成为当前电视时政新闻运营管理当中的重点.在本文中,笔者针对当前阶段时政新闻传播时所出现的问题进行分析,包括内容缺乏针对性、新闻传播形式单一等,并且提出有效的解决对策.
卫星通信作为空天地一体化网络的重要组成部分,是陆地通信系统的延伸和补充,也是国家经济发展和军事科学重要战略制高点。随着业务量增长和星上可用频谱资源的持续消耗,高通量卫星(High Throughput Satellite,HTS)系统通过点波束实现多个高增益、窄波束共同覆盖较大区域,并且通过频率复用技术有效提升了卫星频谱资源利用率和数据吞吐量。然而,随着多媒体业务崛起带来频谱资源需求上涨问题,HT