一种属性与属性值合二为一的数据约简方法

来源 :第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议(CRSSC-CWI-CGrC2007) | 被引量 : 0次 | 上传用户:zy205806
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Rough集理论是由20世纪80年代波兰人ZPawlak提出的一种新的数学工具,它通过严格的数学公式来处理不精确性、不确定的问题,具有演绎、归纳和常识推理等能力,因此,Rough集理论很快就在机器学习、知识获取、决策分析、数据库知识发现、专家系统和模式识别等方面得到了广泛的应用。现在许多学者对Rough集理论进行了进一步延伸与扩充,如粒及其粒计算相关理论;也有学者把Rough集理论与数学知识相结合,如与Fuzzy集或随机集相结合。因此,Rough集相关理论已经成为信息处理研究中十分重要的基础工具。本文提出一种属性约简和属性值合一约简方法,在进行属性约简时就可得到决策表的核值,在本文第2节中,Step2和Step3步骤都是在求核值,而Step2步骤同时也是在求约简属性集。本文提出方法可以说是知识约简的一种形式化描述。易知,本文算法在求属性值约简时,同时也是在求属性约简。因为,如果一个属性可以被约去,那么它所映射的所有属性值都不是核值,这点是很容易理解的,本文也正是利用该思想。本文提出的方法还需进一步深入研究与推广,把该方法思想应用到粒及其计算中是今后应该继续研究的方向。
其他文献
以1:3的比例建立了四流新型中间包的水模型系统,采用等温物理模拟的方法对内部流场进行了研究。实际生产中应该采取合适的挡墙,使冲击区的面积适中。挡墙开孔应该采用上方大孔、下方小孔的方式,出流方向指向一、二流和三、四流的中心较好。湍流抑制器单独使用对改善中间包内流动效果有限,需要和挡墙一起使用才能取得良好的效果;同时也可以采用挡墙和坝综合使用来改善流场。
小方坯连铸GCr15轴承钢容易在凝固过程中产生宏观偏析,而凝固过程的工艺参数决定了宏观碳偏析的产生原因。本文通过分析小方坯连铸轴承钢的实际生产条件,建立了小方坯连铸凝固传热数学模型,并进而探讨了凝固冷却的基本规律,指导进行修正、优化连铸工艺参数,改善宏观碳偏析。
高炉在既定的操作人员与特定设备下,其喷煤量的均匀稳定性主要取决于喷吹用煤粉的输送性能。本文主要介绍了测量粉体流动性的主要方法,包括Carr指数法、Jenike流动函数法及粒度分形维法。并采用Carr综合指数测量法对多种煤粉进行了实验检测,针对实验结果对煤粉流动性进行了分析。
通过改变马钢2号300m2烧结机前进方向各风箱抽风负压来对整个烧结过程垂直烧结速度进行分段调整,达到了合理优化垂直烧结速度的目的,使烧结矿产质量均有不同程度的提高,并且也使带冷废气温度更高且平稳,有力支撑了带冷废气余热发电。
干熄焦技术作为集环保、节能、改善焦炭质量等诸多优点于一身的新工艺,能够适应现代化的大型高炉生产,鞍钢已经采用了该项技术。本文对在鞍钢使用的结果和存在的问题进行了讨论,并提出了改进的建议。
本文首先建立配水操作指导模型,利用调节配水来稳定烧结终点,能够提前15min给出配水调整的建议。并在此基础上建立自适应模型,现场运行显示模型输出的配水调整建议具有一定可靠性。
遗传算法(Genetic Algorithm,GA)是基于自然界“适者生存”机制的一种全局优化算法。它将问题的可行解编码为由基因组成的染色体,通过模拟染色体群的选择、交叉和变异等操作,不断迭代,最终收敛到高适应度值的染色体,从而求得问题的最优解。遗传算法的基本特征是通过在代与代之间维持由潜在解组成的种群来实现多向性和全局搜索,这种从种群到种群的方法在搜索Pareto解时是有用的。首先,它能同时处理
在有些场合,需要找出函数的多个甚至所有极值点,这类问题被称为多峰搜索问题。为了求解多峰搜索问题,可以通过引入小生境和物种理论,用分享和限制交配机制相结合的方法来实现多峰搜索,该方法是以峰个数已知和峰均匀分布的假设为基础的;另一种方法是通过把函数进行变换,使所有峰等高且被找到的机会均等,再用改进后的遗传算法进行搜索;文[4]把这种思想进行了发扬,用微粒群算法来进行实现。通过分析可以发现,用微粒群算法
目标识别是图像处理和模式识别领域的研究热点,在生物医学领域有着十分广泛的应用前景,如肺癌、食道癌及子宫癌细胞的识别分类等,并且取得了一些可喜的成果。对图像目标的精确分割是医学图像模式识别的重要基础之一。在肺癌细胞识别的应用中,大多数的肺癌细胞图像中细胞核与胞浆之间对比度较低,细胞核边缘与背景之间的边界模糊,再加上背景杂质噪声的影响,这都使得很难对肺癌细胞图像进行较精确的分割。本文介绍强化学习的基本
数据挖掘是指从大量数据中提取出有效的、新颖的、潜在有用的,以及最终可理解的模式的高级过程。其目的是从数据中抽取知识。而分类知识是反映同类事物共同性质的特征型知识和不同事物之间差异型特征知识。从带有类别标号的事例中获取分类知识是现实中经常要解决的问题。所谓分类,就是根据确定的概念外延导出概念的内涵,以便区分新的概念外延,即能够用模型或函数预测那些类标记尚未可知的对象。因此,分类是一种有类标记指导的学