prefix-hash-tree的插入、查找和重构算法

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:skynet0079
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现有的众多文本分类方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法.针对汉语言的特殊性,本文提出利用prefix-hash-tree作为中文词表数据结构,并设计了相应的查找、插入和重构算法,从而可以方便地将中文文本转化为事务数据,该数据结构同时也可以作为一般中文信息处理的电子词表数据结构。
其他文献
本文提出了基于嵌入式数据库实现语义缓存的技术方案(SCEDB, Semantic Cache Based on Em-bedded Database),由于采用嵌入式数据库,在客户端缓存的查询与结果可与服务器的数据
本文以国产数据库管理系统GKD-Base为原型,研究了数据库功能扩展的关键技术问题,在兼容原有的Oracle系统应用的基础上提出一套经过实践检验的解决方案。设计实现了GKD-Base FL/
全文先粗略地回顾了模糊关系数据模型的发展历史及模糊逻辑的基本概念,然后介绍了模糊关系数据模型,提出了模糊元组值的模糊关系中两元组在某属性集上的值“近似相等”的概念。
会议
利用关系数据库来存储和管理RDF数据是一种有效的方法.本文在分析总结了RDF模式和ER模型联系的基础上,提出了一种基于RDF模式的RDF数据存储方法.本文在第3节给出了该方法的具
本文根据双时态数据特点和时态变量now语义,将GR树概念、技术进行扩充,适当地解除一些限制,在充分考虑时态变量语义实现的基础上,建立基于时态变量语义的时态索引技术。 本文
本文开发了GKD-Base PL/SQL引擎,进而在引擎的基础上实现了GKD-Base存储过程和包机制.GKD-Base PL/SQL引擎兼容了Oracle PL/SQL V2.3语言规范,可以使用变量、类型、表达式、
会议
数据库用户认证是数据库服务器通过一些手段判断是否允许客户端以它所要求的用户名进行联接的过程,它是认证技术和数据库技术的紧密结合.本文针对现有PostgreSQL口令认证机制
本文讨论了一种基于颜色的加权多重分块图像检索方法。首先将图像空间按照定义的某种分块策略进行划分,然后将每个分块的前三种主色作为其颜色特征.计算出对应分块的三种主色
会议
本文对黑龙江省9个黑木耳(Auricularia auricular)栽培菌株进行PCR-RAPD扩增和群体聚类分析,在40个10bp随机引物中,筛选出13个引物。结果表明:黑木耳不同栽培菌株之间存在着
在传统的MVC架构中,模型层的业务模型封装了软件系统的所有业务逻辑和规则,在视图层和控制层中完全不包含业务逻辑,但在当前流行的网络应用中,在三个层次上都会出现业务逻辑,都含