文本数据挖掘在工程图文档中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:laoniuge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本数据挖掘技术是自然语言处理研究的重点问题之一,而工程图文档是工业技术中的重要数据媒体之一。在信息时代,同其他多媒体数据一样,工程图文档作为一种在网上共享传输的数据媒体,有着信息保护和信息检索的需求。传统的信息保护和信息检索技术均基于文本,而工程图文档中存在的大量文本信息,于是我们将文本数据挖掘技术引入工程图文档中。本文对文本数据挖掘在工程中的应用进行了研究,内容文本信息抽取、文本分类、信息隐藏、信息检索等等。本文主要研究了如下两个问题:一、到目前为止,尚没有大型搜索网站将工程图纳入自己的搜索数据类型。本文将文本数据挖掘的方法,引入到工程图文档的信息检索技术中。研究了工程图文档的信息检索方法,比较了工程图文档检索和一般文本检索的区别,提出了工程图信息检索中的几种新方法,详述了一个构建工程图信息检索系统的实验步骤。二、工程图的信息隐藏在CAD领域中具有重大的意义。为了技术保密,工程图在发布时往往需要将其中的关键信息(如尺寸和材料)隐藏起来,其中大部分需要隐藏的信息是以文本方式存在的。传统的信息隐藏是通过人工的方式进行关键文本抽取并加以隐藏而实现的。本文提出了用线性分类的方法,来实现工程图关键文本的自动抽取,从而达到工程图文档信息隐藏的目的。
其他文献
数字电视目前在国内的展开,这个趋势必将带动国内整个广电产业的巨大变革,而数字电视运营支撑系统(Operations Support Systems,以下简称OSS)是这个产业中的重要一环,而数字电视O
随着计算机网络的广泛应用,网络安全问题已经越来越受到人们的重视。入侵检测是信息安全保护体系结构中的一个重要组成部分,确保计算机网络资源的安全性。入侵检测的关键问题
每个人的指纹在图案、断点和交叉点上都各不相同,且一般人的指纹在出生后9个月得以成型并终身不变。正是因为指纹的唯一性和终身不变性,指纹识别技术才得以迅速的发展和广泛的
随着计算机网络的广泛应用和发展,很多有价值的数据已经不能被传统的搜索技术检索出来,这些数据称为Deep Web。为了有效的访问Deep Web中的数据资源,人们提出了语义Web的概念。
随着信息时代的到来和网络技术的发展,协同设计成为一种必然的趋势,如何快速、高效地共享设计信息成为亟待解决的问题。自1984年计算机支持的协同工作这一概念诞生至今,十几
呼叫中心(Call Center)是CTI技术(Computer Telecommunication Integration)的一个典型应用。其集语音技术、计算机网络和数据库技术于一体,通过电话系统,连接到某个信息数据
CORBA系统中通常的对象传递方式是传递对象引用,通过传递对象引用,避免了传递复杂对象的系统开销和通信开销,实现了客户端与服务端实现的分离。随着分布应用的发展,为了满足
在数据库系统和计算机视觉两大研究领域的共同推动下,图像检索技术已逐渐成为一个非常活跃的研究领域。基于内容的图像检索不同于传统的基于文’本的图像检索,它实际上是一种模
数字信号处理器是一种新型的结构特殊的单片微计算机,特别适用于数字滤波、高保真的视频、图象和语音处理中,并以其强大的处理能力和高度的灵活性迎合了信号处理任务对实时性
模体发现问题,即寻找转录因子结合位点(TFBS),是生物信息学上研究的热门问题之一。由于模体蕴含着丰富的生命遗传特征信息,所以探究基因序列上的模体实例,对基因表达和调控具有重