自动文摘和文本过滤中自然语言智能信息处理技术的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:q28100125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文从方法论上较系统的研究和探讨了自然语言处理技术在不同场合的应用.论文内容分为两大部分,第一部分是关于自然语言理解的方法论,其中详细介绍了基于全信息理论的自然语言理解方法的基本原理,指出全信息自然语言理解方法的特色是把"基于规则"和"基于统计"两种方法有机地结合起来,增强对自然语言的理解能力.第二部分是在对全信息自然语言理解方法论深刻领会的基础上,将理论付诸实践的过程.当前网络信息技术飞速发展,自动文摘和文本过滤等网络智能业务日益成为人们关注的焦点.而要想真正提高这些智能业务的智能化程度,就必须借助自然语言处理技术的强有力支持.我们以全信息自然语言理解的方法论为指导,对自然语言理解技术在这两个领域的应用进行了研究和探索.取得的成果包括:(一)采用有效的语义、语用信息表示方法,将机械文摘方法和统计文摘方法有机地纳入全信息自然语言理解的框架,实现了一个基于机器学习的"近似理解型"的自动文摘系统.(二)深入研究了自动文摘的评测问题,借鉴机器翻译中的自动评测方法,对文摘进行了基于内容的评测实验.(三)提出一种文摘语料库的自动标注方法,通过对文本的意义段划分、句子间的冗余和指代关系识别,实现了一个行之有效的文摘语料库标注工具.(四)从语法、语义和语用三个层面对文本内容过滤问题进行了深入地分析,采用统计粗分和规则细分相结合的方法,在全信息自然语言理解的框架下,实现了网络信息安全监控目标下的文本过滤和倾向识别.(五)在文本倾向识别的研究中,运用基于常识的情感推理机制,进行了自然语言深层理解方面的大胆尝试.
其他文献
本文详细论述了激光通信系统的研究和设计过程,并展望了激光通信的发展前景。介绍了激光发射系统的原理,研究了激光发射电路设计、脉冲分配器电路设计与激光电源设计问题,并对激
本论文的研究方向是信息隐藏领域中以数字图象为载体的密写和密写分析技术,该课题由国家自然科学基金项目"数字音频中高度稳健的数据隐藏技术"(60072030)和"基于统计盲分析理
现将我院老年患者无痛胃镜检查中的配合及护理体会介绍如下.rn1 临床资料rn1.1 一般资料 2007-06/2007-07老年患者行无痛内镜检查73例,男52例,女21例.年龄60~81岁.
基于多载波技术的无线传感器网络的应用已经引起了国内外学术界和工业界的广泛重视。由于无线传感器网络的场景部署比较特殊,导致其本身受限于能量和频谱等资源。本论文主要针
电子技术的不断发展和水雷性能的日趋多样化和智能化使得研究新的更为有效的反水雷手段成为现代国防工业中尤为重要的组成部分。猎雷声纳就是在这样的情况下诞生的。它是利用安装在船底部声纳基阵腔内的声纳发射的声波,经目标反射后成像在显示屏上,从而确定水雷的存在及位置。 本文分别研究了声纳基阵姿态稳定系统的PID控制及滑模变结构控制方法,设计了相应的控制器,针对仿真结果,比较了两者之间的优劣。仿真结果表明