论文部分内容阅读
随着电信网规模的日益庞大和通信技术的迅猛发展,电信网在用户数目和普及率、终端类型、业务种类以及与互联网络的融合程度等方面都呈现出了前所未有的蓬勃趋势。然而,也为电信网信息内容安全领域带来了新的挑战。诸如骚扰音/视频电话和垃圾短/彩信等信息内容安全事件随之增多,影响和干扰了用户的正常工作和生活,为社会和谐发展带来不稳定因素。因此,对此类事件的监管已成为电信网信息内容安全领域的研究热点。信息内容安全事件态势感知,描述了对引起此类事件态势变化的要素的获取、理解和预测,能够为决策提供有效、有力的数据支持,具有重要的现实意义和理论价值。本文将电信网络中典型的信息内容安全事件,即骚扰音/视频电话和垃圾短/彩信作为研究对象;以实现对电信网中以骚扰音/视频电话和垃圾短/彩信为代表的信息内容安全事件的态势感知为研究目标;沿用Endsly提出的经典态势感知框架,将电信网信息内容安全事件态势感知的信息处理过程,分为态势觉察、态势理解和态势预测,其中对态势的理解分为事件分类和态势评估两部分,作为本文的研究主线。主要研究内容和创新点如下:1、提出了一种基于关联规则的态势觉察方法。利用信息内容安全事件自身的特点与常规通信特征的不同,将通信特征中的行为特征、关系特征、位置特征及内容特征的相关数据进行关联挖掘,实现对信息内容安全事件的发现;针对大数据情况下可能存在的虚警问题,提出了基于邦弗朗尼校正的检验准则,对得到的频繁项集是否符合事件发生条件进行筛选。实验结果表明,该方法切实有效,在低虚警率和漏检率的情况下,具有较好的检测率;2、提出了分布式幂级Apriori算法和层次式协同演化遗传算法,分别针对离线和在线数据进行关联规则的挖掘。其中,分布式幂级Apriori算法在Apriori算法原理的基础上,采用幂集法生成所有经过1次支持度筛选后的频繁1项集的子项作为候选项,减少了扫描数据库和剪枝次数,提高了运算速度,并且保留了原算法中可能被滤除的频繁项集,使得结果更为完备。实验结果表明,该算法运行时间短,并行运算能力强,性能优于现有Apriori算法;层次式协同演化遗传算法中,采用层次式结构,对由项集形成的子种群采用遗传算法进行演化,作为局部解,对形成的优势种群采用合作协同思想进行演化,实现信息的交互和传递,从而将局部解整合得到全局解。实验结果表明,该算法在保证一定准确率的前提下,运行速度快、聚焦能力强、泛化性好,在大规模数据处理中具有较高的优越性;3、提出一种多维信息联合的LDA模型的事件分类方法。以网络通信中的时间特征为轴,对由此划分出的各个时间片段中的用户信息和通信内容特征采用LDA模型进行建模分类,对分类结果的相似性进行度量后,再与增量更新数据部分的分类结果归纳合并,从而实现对数据集中所含事件的在线分类。实验结果表明,该模型具有较好的泛化能力和事件分类能力,可以有效实现对信息内容安全事件的在线分类。与其他分类算法相比,提出算法可在较短时间内完成对事件细粒度的分类,准确度较高;4、提出了一种层次化的态势评估模型。该模型采用层次式结构,分别对事件级、区域级和系统级的态势评估值进行计算。其中,事件级态势利用事件特征中的行为特征和内容特征进行计算;区域级态势则依据关系特征和位置特征;系统级态势整合所涉及的各区域级态势,对各级态势评估值参数的计算方法进行了定义。实验结果表明,该模型及计算方法具有可行性和可靠性,在对信息内容安全事件的态势评估过程中,能够有效反映事件的变化及其影响程度;5、提出了一种基于精英选择模型的免疫遗传算法优化RBF神经网络的态势预测方法。模型采用精英选择策略,确保优良基因得以保留进入下一代。同时,通过退火因子的扰动,在一定程度上增加了变异的多样性,提高整个算法的收敛速度和局部搜索能力。实验结果表明,该算法可以准确地对信息内容安全事件的态势做出预测,与实际数据的拟合度较高,有效体现了事件强度的变化趋势。算法具有的强收敛性,减少了训练的成本,降低了算法的学习时间,综合性能与现有算法相比具有优越性。