中文信息检索中相关算法的研究

来源 :辽宁科技大学 | 被引量 : 2次 | 上传用户:luck_mike
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,网络上电子可读文本的日益增加,呈指数膨胀的文本信息资源,使得如何准确有效地获取用户所需要的信息成为人们关注的热点,促进了文本处理领域的形成和发展。自动收集和整理所需要的各类信息成为信息产业面临新的挑战和新的发展契机,而信息检索技术是解决这些问题的关键。根据不同的应用背景和不同的使用目的,信息检索技术已经演化为信息检索、信息过滤、信息分类、文本摘要,和问题回答等方向。 由于信息主要是以文本形式表示,本文主要讨论中文文本检索和相关应用的处理技术。文本检索主要研究的对象是大规模、非结构化的真实文本,进行文本分类、文本检索、文本过滤和文本摘要等方面处理,以满足用户的信息需求。 本文主要讨论的问题包括:提高文本检索效率的索引文件系统和提高系统精度的相关反馈技术等。 文本分类既可以作为独立应用系统,也可以作为检索系统的组件用以提高系统的效率。作者建议在检索系统中采用层次分类方法。
其他文献
电信业务的不断丰富以及客户个性化服务问题的提出,按照单独的电信业务进行单一的销售、计费的方式已经远远无法满足多业务交叉、打包销售、灵活计费的要求。单一的业务逐渐向
近年来,随着软件的迅速发展,软件复用已成为解决软件危机、提高软件生产率的最有效、最具潜力的手段。软件构件库,则是提供软件复用的机制和软件资源管理的基础设施。构件库
随着信息技术应用的越来越广,一个突出的问题也随之而生,那就是信息爆炸,特别是对于现今的企业,由于国际合作的不断加强,企业规模的不断扩大,所产生的信息也越来越多,在加上以前保存
本文对XML文件树状路径查询处理进行了研究。文章将用户输入的XQuery转化为查询树的数据结构,并将其查询语句中的文本值限定和结构限定都记录在此结构中。由于DTD中记录了XML
随着信息社会的发展,网络互连的规模越来越大,连网设备越来越多样,解决异构网络设备的互连问题,开发出符合网络管理标准的设备已经成为众多设备生产厂商的迫切需求。网络设备
门限秘密分享方案是保护秘密的重要手段,在密钥管理、多方安全计算等领域有着重要的应用,而最初的Shamir门限方案并未关注秘密分片的可验证性,这削弱了方案本身的健壮性。近些年
近年来由于计算机技术和电子商务的高速发展,企业可获取的信息数量和类型有了极大的增长。在企业应用和Web数据集成的需要下,Web环境下的数据集成系统的研究己成蓬勃发展的趋
运动模糊图像的复原问题是图像恢复技术当中最重要的课题之一。运动模糊在日常生活当中极其常见,比如日常生活当中拍摄移动状态的物体、交通摄像头拍摄运动状态中的目标车辆以
乳腺癌是严重危害女性身心健康的常见恶性肿瘤,是世界各国女性死亡的主要原因之一。由于乳腺癌的病发机理还未完全弄清楚,因此早发现、早诊断及早治疗对防治乳腺癌十分重要。目
证据理论是处理由认识的局限性所带来的不确定性问题的有力工具,它处理的证据来源于专家,但专家的知识经验往往是有限的,获取也较困难,且可能存在一定的主观性。粗糙集理论反映了