概念格分布处理及其框架下的知识发现研究

来源 :辽宁科技大学 | 被引量 : 1次 | 上传用户:yan303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
概念格也称为Galois格,是形式概念分析理论中的核心数据结构,它利用二元关系建立一种概念间的层次关系,是进行数据分析和规则提取的有效工具。随着研究深入,形式概念分析越来越多地被应用到数据挖掘、信息检索、软件工程等方面,已经成为当前计算机科学领域的一个热门研究课题。围绕这个背景,本文开展以下研究:概念格以其良好的数学性质已成功地应用于知识发现等诸多领域,但由于概念格自身的完备性,构造概念格的时间一直是影响形式概念分析应用的主要障碍。本文详细分析了现有各种建格算法的利弊,结合各自的特点,提出了一种新的剪枝策略来构造概念格,动态形成剪枝条件,避免了概念格构造过程中部分无效闭包的生成。随着处理的形式背景的增大,构造概念格的时空复杂度也会随之急剧增加。采用分治策略来构造概念格是解决这一问题的有效途径。本文基于概念格闭包系统划分的思想,提出了一种新的概念格并行构造算法,把概念格对应的闭包系统划分为多个独立的子闭包系统然后分别进行概念的计算。从数据库中提取规则是知识发现的主要内容,如何减少冗余规则的提取,降低搜索空间,是当今KDD研究总的一个热门课题。本文基于概念格闭包系统划分的思想,把概念格的分布处理应用于数据挖掘领域中频繁项集的计算,以保持原有信息不变为根本,对事务数据库进行拆分,在每个子事务数据库内进行频繁项集的计算。概念之间的关系是有序的,通过所对应的Hasse图,可以形象地揭示概念间的泛化和特化关系,反映概念间的层次结构。然而在生成每个概念前,对形式背景中的对象集合或属性集合的每个元素,在未规定字典序前,是不可比的,本文从这一点着手,把概念视为形式背景中的最大“矩形”,研究了概念格中概念信息的图形化,并用之于概念格中相关定理的证明。对手写数字串的识别首要的一个任务就是要把数字串拆分成单个数字,本文基于类的划分,把聚类分析的思想应用于数字串的拆分。
其他文献
无线传感器网络已经成为当今的热门研究领域之一,而如何将IPv6与传感器网络结合也成为其中的一个重要议题。IETF成立的6LoWPAN工作组,专门从事基于IEEE 802.15.4标准的IPv6协议
随着SoC系统级设计的飞速发展,从更高层次描述系统的行为,从而减少仿真时间以加速设计收敛,变得非常迫切。特别,当要建模的目标系统十分复杂时,设计者需要对目标设计更早的有
随着面向对象技术的发展,如何设计可复用的面向对象软件越来越受到关注。当应用软件的复杂度不断加大时,单凭个人的设计经验已经不能解决所有的设计问题,利用资深软件工程师
数字图像处理是指为了获得期望的结果,对数字图像进行处理和变换的技术。图像能够让信息的传输和表达更加的简单快捷。随着信息技术的不断发展,数字图像在新闻、医学、国防、
虚拟实验作为一种新的实验教学模式,弥补了传统实验设备的一些缺陷,是实验教学的一个新的发展方向。组成原理是计算机专业的一门重要的专业基础课。对于这种实践性很强的课程
目前,随着信息总量越来越快地增长,信息类型也越来越复杂,文字、图片、音频、视频等要素不断充斥着互联网,当今的网络正朝着要素多元化的方向不断发展。在这样一个类型和数量
DICOM(Digital Imaging and Communication in Medicine)标准是医学影像环境中的高层网络通信协议,说明了影像系统之间通过网络进行图像交换和实现互操作的规范,使得不同厂商
图像检索一直以来就是学术界和工业界的研究热点领域,随着信息技术的发展和大数据技术的火热,人们在互联网上交流方式越来越集中到图像、视频等多媒体形式上,图像检索在互联
风能,作为一种清洁、环保、安全、可再生的绿色能源,近些年得到了快速的发展。随着我国关于风力发电的“十二五”专项规划的执行,风电产业已经取得了令人瞩目的成绩,成为新能源领域的佼佼者。但是由于风速具有很强的随机性和不可预测性,从而会引起整个风场功率产生较大的波动性和间歇性,进而对风电并网、电压控制等带来一定的困难。有数据显示,当风电的穿透功率超过8%时,会对电网的安全性与稳定性带来严重的危害,在一定程
云存储作为云计算的存储基础正随着大数据时代的到来发挥着越来越重要的作用。云存储采用分布式架构来应对海量数据的存储。如何在可靠性、高性能等方面提高云存储的服务能力