基于军交领域的多源文本信息提取与检索

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yinyueli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学技术的日新月异和新军事革命的深入发展,战争的形态正由传统的机械化战争向信息化战争转变。在战争迈向信息化的进程中,信息要素已成为军队战斗力的基本构成要素,将取代物资和能量要素成为战争的决定要素。夺取战场“制信息权”已成为交战双方斗争的焦点,白海湾战争以来几次高技术局部战争的实践证明“制信息权”已经成为现代战争的命脉。在夺取“制信息权”的斗争中,军事信息的挖掘利用更显突出。   目前部队已基本上全面实现了电子化办公。由于文档格式的多样性和数量的急剧增加,文档的归类、管理、查找显得越来越困难,要在高技术条件下赢得战场上的胜利,争取时间、赢得时间显得尤为重要。一套快速有效的全文检索系统对缩短首长决策时间、赢得主动权将起到非常重要的辅助作用,在军事交通领域更是如此。军交领域文本信息主要有以下特点:   ①未登录的人名、地名繁多;   ②专有名词繁多;   ③文本基本按照固定格式书写;   ④类似本文和后续文本较多。   然后详细分析了现有分词词典机制,根据军事交通领域词汇用词较规范,词的内涵、外延明确的特点解决语义的复杂性,建立适用于军交领域的词典机制,并分析比较了实验结果,在专业领域上优于其他的分词词典。   其次在适用于军交领域的词典基础上,利用Lucene引入ICTCLAS分词机制实现分词,并对文本信息进行预处理。   另外对基于军交领域的全文检索系统的实现:使用Eclipse编程,利用Lucene全文检索引擎工具,实现了全文检索系统,并通过举例的方式说明各个步骤的功能。   最后,本文对研究工作进行了总结,提出了今后进一步的研究方向。
其他文献
近年来,随着互联网的普及,音频流媒体以其低成本和方便性得到了广泛的应用。但是现在的因特网只能提供被称之为尽力而为(best-effort)的服务,网络的拥塞将导致丢包和延迟现象
互联网信息技术和电子商务的日新月异,使得方便快捷的网络购物成为一种不可或缺的购物方式。网络上的服饰商品数量类型繁多,怎样从中有效地搜索到目标商品是决定消费者是否发
随着网络技术的发展和普及,计算机系统的安全性越来越受到人们的关注。由于计算机系统存在多种安全性缺陷,所以在计算机系统的设计和开发过程中,如何测试系统的安全性,是开发
本课题来源于国家自然科学基金资助项目——“基于Ontology的文本中空间关系的三维可视化研究”(简称文景转换),该项目以基于Ontology的自然语言文本到相应的三维动态虚拟场
从大量繁杂的文本信息中获取有用的信息是信息处理的一大任务,而文本分类是实现这个任务的最重要的方法之一。向量空间模型是进行大规模文本处理常用的表示模型,而类中心分类
嘴唇动画作为人脸动画中最重要的部分之一,可以应用在影视特效,动画制作,游戏娱乐以及视频会议等诸多领域,具有很大的应用价值和商业价值。本文研究的内容是如何利用视频驱动
医学图像三维重建,是计算机图形学和数字图像处理技术在生物医学工程中的重要应用。医学三维重建技术已经成为医院诊断、治疗的重要依据和手段,在医学诊断、手术规划、模拟仿
大量低成本、多功能、微小体积的传感器节点可以分布在一定的区域中形成大规模的、动态拓扑结构的、应用相关的自组织网络。良好的拓扑结构支持传感器网络中的诸多应用,数据
在传统的汽车车身网络中,大量的电子控制单元使得汽车内部导线的数量大大增加由此导致有限的车内空间被繁多的线束占据。随着电子技术的发展,传统式车身通信网络不再适用,汽
面对信息爆炸而产生的海量文本信息,如何更快速、准确地从中获取需要的信息,是人们普遍关注的问题。文本信息抽取的研究工作,便是在这种需求背景下产生的,旨在提供从海量联机