论文部分内容阅读
摘要:在军事领域中对群体目标的分布特征的分析能够为精确武器制导提供强有力的数据支撑,而实现群体目标分布形状的实时分析是群体目标分布特征分析中的关键环节。为此本文提出了基于图论的聚类分析算法对阵地目标群的分布特性进行分析,并计算目标群的分布参数(分布范围、分布形状、分布密度)。通过仿真实验验证了本文所提出的算法对于描述目标群的分布特征具有很好的适用性。
关键词:目标群散布特性图论聚类分析加权熵
中图分类号:E20 文献标识码:A 文章编号:1672-3791(2011)01(a)-0249-02
新时期的战场信息研究由以往单个目标基本特征(包括几何特征、定量描述和数字特征)的研究逐渐过度到群体目标的空间分布特性研究,以此提高军事情报的时效性,为精确制导武器提供攻击目标、攻击范围及其先验信息,进而实现精确制导武器杀伤效果的评估。要使制导武器的攻击力度准确度达到最大,有针对性地对战时要重点打击的对像进行攻击,我们应该对军事阵地目标群进行分析,找出重点打击对像,集中炮弹落到重点攻击目标上,集中能量来攻击目标。因此我们要对阵地目标群的分布特征进行分析,确定有效的攻击范围。对此首先要解决的就是一个分类的问题。通过对目标群进行分类,进而确定目标群中密集度大的地方为主要攻击目标。
传统的聚类分析必须在聚类前给定聚类的原型类型以及聚类类别数,否则得不到好的效果。而阵地目标群空间分布形态的多样性与不确定性使得目标群的分布范围没有固定的形状,因此传统的聚类分析算法达不到较好的分析精度。而基于图论的分析方法主要研究点与点以及点与点之间的关系[1],可以把很多复杂的问题简单化,并且可以很好的区分识别各种形状的图形。为此本文提出了基于图论的聚类分析算法对目标群分布特性进行研究。
1 目标群的散布特性的分析
在军事领域中群体目标的分布特征分析能够为精确武器制导提供可靠的先验信息。我们对目标群分布范围和分布密度进行分析,将目标群较密集的部分做为攻击的主要部分,进而提高武器的命中率,保证命中概率。在此我们采用基于图论的聚类分析算法对目标群进行分类。
具体实现步骤如下。
(1)获取目标群图像,并校正,得到平行于攻击目标平面上的目标群的群体目标图像。
(2)构建数据集。由于目标群个体的面积大小不一,为了减少误差提高精确度在聚类的过程中将目标个体抽像成由许多距离很近的质点组成。将整体群体目标图像作为研究对像进行聚类分析。
2生成数据集的最小支撑树。
从个样本点中任意挑出一个点,然后计算该点与其他各点的距离,即边长,假设其中为最短距离,而这个边长的另一个端点为,通过找出除之外的最短边长,设为,它的另一个端点为,…,直到将n个样本点全部连接起来,就可得到最小支撑树。
3选取合适的阈值,将最小支撑树中大于阈值的边移去,得到所有子树,则每一个子树可以看成是数据集的一个分类
阈值的选取采用加权熵最大时的边值作为最小支撑树的划分阈值边[2]。具体实现方法如下。
构建最小支撑树得到边值集合,对每一个边值分别进行如下计算。
(1)选取最小支撑树的任意一个边,将此边看成阈值边,将最小支撑中边值大于阈值的边移去,形成最小支撑树的一个子树分布状态,将每一个子树看成是树据集的一个分类。
(2)按式
其中,(为子树的边值,为总边值)计算此阈值划分下各个子树的边值构成的一个概率分布。
(3)按式计算此阈值划分下各个类的加权系数,其中为类内数据样本数,为数据集总样本数,为类内差,为类间差,为指标控制参数,为大于1的定值,保证。
(4)按式计算此阈值下加权熵。
通过以上方法,对目标群进行分类,得出最优分类结果,然后对每一类的分布参数进行分析如下。
(1)分布范围:由于类内所有点均落在且的区域内,因此该范围能够反映群体目标的分布范围。
(2)分布中心:,是第i类的样本数。
(3)分布密度:由公式计算密度[3],其中,,,是常数。由的表达式可见,中心样本点周围的点越多,则密度就越大;反之,若中心样本点周围的点越少,则密度就越小。
(3)仿真实验及分析。
针对上述算法,本文采用仿真实验进行验证,并将本算法与FCM算法和常用的密度聚类算法进行比较。实验仿真目标群示意图如下所示,图像分辨率为128×128(图像方向平行于攻击目标平面):图1为目标群仿真示意图,三类数据的理论中心分别为(76,88),(124,116),(164,153)。三类数据形状各不相同,且分布不均匀,密度不同。图2是FCM聚类方法,事先给出聚类数目为3,随机选择初始聚类中心得到的聚类结果。结果显示不能得到正确的聚类。图3是常用的密度聚类方法聚类的结果,数据集被分作了三个类。其中中间部分的数据集多数被当成噪声处理了(类内每个点分别由1,2,3表示,噪声点由n表示),产生了错误的结果。因为密度聚类是基于密度的聚类方法,所以对于密度分布不均的数据集,往往得不到满意的聚类效果。图4是基于图论的聚类算法的聚类结果,本算法不依赖于密度且不需要初始聚类中心和聚类数,所以可以得到很好的聚类效果。
根据表1分析结果我们可以看出,不同的阈值选取,得到的数据集的分类数不同,只有在加权熵最大时的分类数是最为准确的。分类后不同聚类算法得到的分布参数如表2所示。
表2为用不同聚类方法分类后得出的分布参数,通过与三类数据的理论中心比较可知,基于图论的聚类算法聚类后得到的分布参数和理论值相差最小,得到的分布参数最好。
4結语
本文主要研究了阵地目标群的分布特性,提出了一种基于图论的目标群分布特性分析算法。对于一个待识别目标群来说,首先获取该目标群的图像,构造该目标群图像的数据集,然后生成该数据集的最小支撑树,并选取合适的阈值边对数据集进行分类,在阈值的选取上我们遵循最大熵原则[4],选取加权熵最大的边作为最小支撑树的划分阈值边,从而得到准确的分类,最后得出目标群的分布参数。通过仿真实验表明本算法能够很好的实现群体目标分布特性描述的基础上,实现群体目标的分布参数提取。
参考文献
[1]张鹏程,甘肃冬地区农产品的图论聚类分析.统计与咨询.2008,27(11):15~17.
[2]严学强,等.基于量化直方图的最大熵阈值处理算法[J].模式识别与人工智能,1998,11(3):355~358.
[3]范九伦.模糊聚类算法与聚类有效性问题研究[J].西安电子商务科技大学,1998.
[4]Jaynes,E.T.Information theory and statistical mechanics[J].The physical review,106(1957):620~630.
关键词:目标群散布特性图论聚类分析加权熵
中图分类号:E20 文献标识码:A 文章编号:1672-3791(2011)01(a)-0249-02
新时期的战场信息研究由以往单个目标基本特征(包括几何特征、定量描述和数字特征)的研究逐渐过度到群体目标的空间分布特性研究,以此提高军事情报的时效性,为精确制导武器提供攻击目标、攻击范围及其先验信息,进而实现精确制导武器杀伤效果的评估。要使制导武器的攻击力度准确度达到最大,有针对性地对战时要重点打击的对像进行攻击,我们应该对军事阵地目标群进行分析,找出重点打击对像,集中炮弹落到重点攻击目标上,集中能量来攻击目标。因此我们要对阵地目标群的分布特征进行分析,确定有效的攻击范围。对此首先要解决的就是一个分类的问题。通过对目标群进行分类,进而确定目标群中密集度大的地方为主要攻击目标。
传统的聚类分析必须在聚类前给定聚类的原型类型以及聚类类别数,否则得不到好的效果。而阵地目标群空间分布形态的多样性与不确定性使得目标群的分布范围没有固定的形状,因此传统的聚类分析算法达不到较好的分析精度。而基于图论的分析方法主要研究点与点以及点与点之间的关系[1],可以把很多复杂的问题简单化,并且可以很好的区分识别各种形状的图形。为此本文提出了基于图论的聚类分析算法对目标群分布特性进行研究。
1 目标群的散布特性的分析
在军事领域中群体目标的分布特征分析能够为精确武器制导提供可靠的先验信息。我们对目标群分布范围和分布密度进行分析,将目标群较密集的部分做为攻击的主要部分,进而提高武器的命中率,保证命中概率。在此我们采用基于图论的聚类分析算法对目标群进行分类。
具体实现步骤如下。
(1)获取目标群图像,并校正,得到平行于攻击目标平面上的目标群的群体目标图像。
(2)构建数据集。由于目标群个体的面积大小不一,为了减少误差提高精确度在聚类的过程中将目标个体抽像成由许多距离很近的质点组成。将整体群体目标图像作为研究对像进行聚类分析。
2生成数据集的最小支撑树。
从个样本点中任意挑出一个点,然后计算该点与其他各点的距离,即边长,假设其中为最短距离,而这个边长的另一个端点为,通过找出除之外的最短边长,设为,它的另一个端点为,…,直到将n个样本点全部连接起来,就可得到最小支撑树。
3选取合适的阈值,将最小支撑树中大于阈值的边移去,得到所有子树,则每一个子树可以看成是数据集的一个分类
阈值的选取采用加权熵最大时的边值作为最小支撑树的划分阈值边[2]。具体实现方法如下。
构建最小支撑树得到边值集合,对每一个边值分别进行如下计算。
(1)选取最小支撑树的任意一个边,将此边看成阈值边,将最小支撑中边值大于阈值的边移去,形成最小支撑树的一个子树分布状态,将每一个子树看成是树据集的一个分类。
(2)按式
其中,(为子树的边值,为总边值)计算此阈值划分下各个子树的边值构成的一个概率分布。
(3)按式计算此阈值划分下各个类的加权系数,其中为类内数据样本数,为数据集总样本数,为类内差,为类间差,为指标控制参数,为大于1的定值,保证。
(4)按式计算此阈值下加权熵。
通过以上方法,对目标群进行分类,得出最优分类结果,然后对每一类的分布参数进行分析如下。
(1)分布范围:由于类内所有点均落在且的区域内,因此该范围能够反映群体目标的分布范围。
(2)分布中心:,是第i类的样本数。
(3)分布密度:由公式计算密度[3],其中,,,是常数。由的表达式可见,中心样本点周围的点越多,则密度就越大;反之,若中心样本点周围的点越少,则密度就越小。
(3)仿真实验及分析。
针对上述算法,本文采用仿真实验进行验证,并将本算法与FCM算法和常用的密度聚类算法进行比较。实验仿真目标群示意图如下所示,图像分辨率为128×128(图像方向平行于攻击目标平面):图1为目标群仿真示意图,三类数据的理论中心分别为(76,88),(124,116),(164,153)。三类数据形状各不相同,且分布不均匀,密度不同。图2是FCM聚类方法,事先给出聚类数目为3,随机选择初始聚类中心得到的聚类结果。结果显示不能得到正确的聚类。图3是常用的密度聚类方法聚类的结果,数据集被分作了三个类。其中中间部分的数据集多数被当成噪声处理了(类内每个点分别由1,2,3表示,噪声点由n表示),产生了错误的结果。因为密度聚类是基于密度的聚类方法,所以对于密度分布不均的数据集,往往得不到满意的聚类效果。图4是基于图论的聚类算法的聚类结果,本算法不依赖于密度且不需要初始聚类中心和聚类数,所以可以得到很好的聚类效果。
根据表1分析结果我们可以看出,不同的阈值选取,得到的数据集的分类数不同,只有在加权熵最大时的分类数是最为准确的。分类后不同聚类算法得到的分布参数如表2所示。
表2为用不同聚类方法分类后得出的分布参数,通过与三类数据的理论中心比较可知,基于图论的聚类算法聚类后得到的分布参数和理论值相差最小,得到的分布参数最好。
4結语
本文主要研究了阵地目标群的分布特性,提出了一种基于图论的目标群分布特性分析算法。对于一个待识别目标群来说,首先获取该目标群的图像,构造该目标群图像的数据集,然后生成该数据集的最小支撑树,并选取合适的阈值边对数据集进行分类,在阈值的选取上我们遵循最大熵原则[4],选取加权熵最大的边作为最小支撑树的划分阈值边,从而得到准确的分类,最后得出目标群的分布参数。通过仿真实验表明本算法能够很好的实现群体目标分布特性描述的基础上,实现群体目标的分布参数提取。
参考文献
[1]张鹏程,甘肃冬地区农产品的图论聚类分析.统计与咨询.2008,27(11):15~17.
[2]严学强,等.基于量化直方图的最大熵阈值处理算法[J].模式识别与人工智能,1998,11(3):355~358.
[3]范九伦.模糊聚类算法与聚类有效性问题研究[J].西安电子商务科技大学,1998.
[4]Jaynes,E.T.Information theory and statistical mechanics[J].The physical review,106(1957):620~630.