论文部分内容阅读
现代战争是信息的较量,在战争“迷雾”中,能否通过信息优势使指挥员准确把握当前态势,在“看”的同时达到“知”,是决定战争胜负的重要因素。因此,态势评估在现代战争中有着不可替代的作用。传统态势评估的模型构建非常依赖先验知识、预选参数与有监督数据,缺乏动态更新能力。因此,近年来不少研究试图利用关联规则挖掘,直接从无监督战场事务数据中得到评估模型。然而,大部分研究对战场数据的设想过于简单,并未考虑其复杂性。本文针对战场数据属性类型多样、规模庞大、高维度和天然失真的特点,对面向态势评估的关联规则挖掘技术进行了深入研究,具体工作如下:1.提出基于中心极限定理(CLT,Central Limit Theorem)的战场对象间模糊关联规则挖掘算法CLTF。CLTF能将战场对象数据转换为模糊事务,并通过CLT对其简约,快速得到战场对象间模糊关联规则。CLTF主要解决两个问题。首先,关联规则挖掘所需的事务数据无法在战场中直接获得,在把战场半结构化数据转换为事务数据的过程中,数值型属性难以离散化;其次,大规模战场事务数据对关联规则挖掘的实时性构成挑战。针对这两个问题,CLTF在生成事务数据时,利用三角隶属度对其中的数值型属性软分割,形成模糊事务;同时,CLTF依据乘积三角模特性,将模糊事务数据等价为二元事务数据,并利用CLT进行合理采样,确保挖掘的实时性。由CLT计算的样本规模可保证将任意模式的支持度误差以大概率控制在小范围内。2.提出基于CLT与Union界的战场二元事务数据简化算法CLTU。CLTU可有效减少由战场半结构化数据转换而来的事务数据规模,并对挖掘结果提供强精度保证。CLTU是CLTF中采样部分的深入扩展。虽然在CLTF中,基于CLT所计算的样本规模可保证任意模式的支持度误差极小,但这些小误差会在后续推理过程中不断积累,造成隐患。因此,CLTU对数据的简化程度进行了更严格的控制,可保证所有模式支持度的最大误差以指定最小概率落入指定区间。同时,CLTU利用噪声项剔除、事务简约、事务合并这三个步骤避免了简化后数据规模的过估计。3.提出基于二元粒子群(BPSO,Binary Particle Swarm Optimization)的战场高维数据长模式挖掘算法BPSOHD。BPSOHD可高效地在大量战场目标及事件中搜索长模式。战场长模式挖掘的困难主要来自于两点。首先,长模式支持度极低,十分容易与噪声短模式混淆,给设置最小支持度带来了挑战;其次,战场数据的高维特性使长模式极为隐蔽,增加了挖掘难度。针对这两点,BPSOHD利用BPSO直接对长模式进行搜索,避开了最小支持度设置;同时,BPSOHD利用初始种群降维与搜索空间动态降维对传统BPSO进行了改进,优化了高维数据下的搜索效率,使其性能得到提升。4.提出数据失真时的关联规则可靠性排序与匹配算法ARSA。ARSA能在侦察数据天然失真的情况下,合理选择关联规则并进行态势评估。由于战场侦察过程无法避免漏识别与误识别,所以从数据中得到的关联规则与战场客观规则间有一定出入。因此,本文通过合理假设对数据失真带来的影响进行理论分析。根据理论分析结果,ARSA对所有规则展开排序,筛选出既与已知对象匹配,优先级又高的规则参与态势评估,在一定程度上弥补了数据失真给关联规则带来的负面影响。基于以上研究,本文设计并实现了基于关联规则挖掘的态势评估原型系统,通过案例验证,说明了其在态势评估中是可靠且高效的。