嵌入式中文信息系统的检索研究与应用

来源 :贵州大学 | 被引量 : 0次 | 上传用户:haobishuiduo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在针对公安部门开发的《移动警务助理嵌入式信息系统》系统中,其数据记录有30多万条,该系统由是由PC端和PDA端的两部分应用程序组成两部分软件可以通过串口或USB,或网络等设备通讯,完成PC端和PDA端数据上下载功能,从而维护两部分数据的一致性.但是这也导致有可能在PDA端所要处理的数据将和PC端的数据在同一数量级上,也许有的数据量对于PC端的应用程序部分来讲算不了什么,但是对于现阶段的PDA来说有可能就是非常大的数据量.所以这将直接增加PDA端的数据访问的困难.由于这一系统的数据量很大,如果使用一般的嵌入数据库所提供的数据访问方法,例如pocket access,pocket embedded Sqlserver,或使用其它的第三方嵌入数据库,将直接导致查询速度较慢.在系统设计时,曾经使用过第三方数据库产品做实验,实验结果是,当数据记录在10000条左右时,查询时间不到1秒,当数据记录在50000条左右时,查询时间2-3秒,当数据记录在100000条左右时,查询时间10-11秒.实验结果表明采用这些方案行不通.所以必须对数据访问的方法做必要处理,在对存贮空间和和时间上达到平衡.在查询方式上,既要支持对身份证号作为输入的查询,同时又要支持输入名字的查询并支持同音字查询.所以针对记录数较大的(数十万条)的嵌入式中文信息系统的汉语文本检索技术,该文提出使用Hash索引进行记录查询、并同时对汉字进行音码转换,通过汉字内码表和拼音码表来建立转换表,从而实现对汉语同音字二分查找等技术;经过在实际开发中这些技术的应用,最终困难得以解决,效果良好.
其他文献
该论文主要包括五个方面内容.第一部分,定义告警信息语法模型;第二部分,如何从含有很多噪音的告警数据中,发现告警相关性规则的数据挖掘算法的研究;第三部分,如何进行增量数据挖
随着互联网的快速发展,云计算概念持续升温。云计算所具有的高可靠性,可扩展性,按需计费,虚拟化等特性使其在产业界、学术界、政府等各界引起强烈的关注。在互联网的冲击下,
随着移动计算机日益广泛的使用和人们对网络依赖性的增加,如何让人们能够随时随地的访问Internet,在移动的过程中保持通信不间断已经成为当前Internet技术研究的关键问题.传
随着计算机技术和电信技术不断发展和进步,加上日益旺盛的社会需求的持续推动,呼叫中心行业一直处于高速发展。但是多年以来呼叫中心的建设模式还是以自建为主,其高昂的建设
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。被信息产业界认
该文首先简要介绍了机器翻译技术的发展现状和几种主流的机器翻译方法,探讨了基于规则和基于统计两种主要的语言模型,对基于这两种语言模型的盲汉翻译方案进行分析和比较,论
该系统是与秦皇岛交通局运管处合作开发的,目的在于开发一套完整的物流管理信息系统,以适应当前物流业的需要和中国加入WTO的需要.该文详细阐述了基于B/S模式的面向业务对象
目前,国外在建立微波元器件神经网络模型时大都采用最速下降法,并且是step-by-step方式,存在着收敛速度慢、需要人工干预的问题.针对这些问题,我们对常用的前馈神经网络训练
贝叶斯网络是一种建立在概率和统计理论基础上的数据分析和辅助决策工具,以其坚实的理论基础、自然的表示方式、灵活的推理能力和方便的决策机制受到越来越多研究学者的重视.
该论文首先分析了现代远程教育的资源状况.当前远程教育,虽然拥有丰富的教育资源,但是由于资源格式的复杂多样,资源建设缺乏规范化,使得用户无法获取、重用这些网上的丰富资