prefix-hash-tree的插入、查找和重构算法

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户：skynet0079

【摘要】

：

在现有的众多文本分类方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法.针对汉语言的特殊性，本文提出利用prefix-hash-tree作为中文词表数

【作者】

：

钱铁云王元珍冯小年

【机构】

：

华中科技大学计算机学院数据库与多媒体技术研究所,武汉,430074

【出处】

：

第二十一届中国数据库学术会议

【发表日期】

：

2004年期

【关键词】

：

数据结构分类方法中文信息处理语言的特殊性中文文本重构算法中文词表训练时间事务数据关联分类准确率多文本转化设计电子

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在现有的众多文本分类方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法.针对汉语言的特殊性，本文提出利用prefix-hash-tree作为中文词表数据结构，并设计了相应的查找、插入和重构算法，从而可以方便地将中文文本转化为事务数据，该数据结构同时也可以作为一般中文信息处理的电子词表数据结构。

其他文献

语义缓存查询处理优化技术及实现

本文提出了基于嵌入式数据库实现语义缓存的技术方案(SCEDB, Semantic Cache Based on Em-bedded Database)，由于采用嵌入式数据库，在客户端缓存的查询与结果可与服务器的数据

会议

语义缓存查询处理嵌入式数据库客户端缓存数据库管理系统替代策略数据存储设计方法技术方案服务器部件化运算修剪

数据库功能扩展技术研究与实现

本文以国产数据库管理系统GKD-Base为原型，研究了数据库功能扩展的关键技术问题，在兼容原有的Oracle系统应用的基础上提出一套经过实践检验的解决方案。设计实现了GKD-Base FL/

会议

数据库管理系统功能扩展触发器机制系统应用设计实现解决方案技术问题中介器原型引擎实践基础

模糊关系数据模型的范式研究

全文先粗略地回顾了模糊关系数据模型的发展历史及模糊逻辑的基本概念，然后介绍了模糊关系数据模型，提出了模糊元组值的模糊关系中两元组在某属性集上的值“近似相等”的概念。

会议

基于RDF模式的存储方法研究

利用关系数据库来存储和管理RDF数据是一种有效的方法.本文在分析总结了RDF模式和ER模型联系的基础上,提出了一种基于RDF模式的RDF数据存储方法.本文在第3节给出了该方法的具

会议

模式存储和管理存储方法关系数据库实现步骤实验模型基础

基于"now"语义时态索引技术

本文根据双时态数据特点和时态变量now语义，将GR树概念、技术进行扩充，适当地解除一些限制，在充分考虑时态变量语义实现的基础上，建立基于时态变量语义的时态索引技术。本文

会议

时态变量语义索引技术语义实现研究模型数据特点数据操作扩充基础关系范式变量索引概念

GKD-Base PL/SQL存储子程序和包的设计与实现

本文开发了GKD-Base PL/SQL引擎,进而在引擎的基础上实现了GKD-Base存储过程和包机制.GKD-Base PL/SQL引擎兼容了Oracle PL/SQL V2.3语言规范,可以使用变量、类型、表达式、

会议

PostgreSQL口令认证机制的分析与改进

数据库用户认证是数据库服务器通过一些手段判断是否允许客户端以它所要求的用户名进行联接的过程,它是认证技术和数据库技术的紧密结合.本文针对现有PostgreSQL口令认证机制

会议

口令数据库服务器认证机制用户认证安全性数据库技术认证技术服务器端用户名易用性客户端性能设计缺陷联接函数攻击

基于颜色的加权多重分块图像检索方法

本文讨论了一种基于颜色的加权多重分块图像检索方法。首先将图像空间按照定义的某种分块策略进行划分，然后将每个分块的前三种主色作为其颜色特征.计算出对应分块的三种主色

会议

黑龙江省黑木耳9个栽培菌株遗传多样性的RAPD分析(英文)

本文对黑龙江省9个黑木耳(Auricularia auricular)栽培菌株进行PCR-RAPD扩增和群体聚类分析,在40个10bp随机引物中,筛选出13个引物。结果表明:黑木耳不同栽培菌株之间存在着

期刊

黑木耳RAPD分析DNA指纹图谱食用菌菌种遗传多样性遗传多态性Auricularia引物菌株DNA

一种MVC架构中的数据组织方法

在传统的MVC架构中，模型层的业务模型封装了软件系统的所有业务逻辑和规则，在视图层和控制层中完全不包含业务逻辑,但在当前流行的网络应用中，在三个层次上都会出现业务逻辑，都含

会议

架构业务逻辑数据组织业务模型组织形式业务操作网络应用数据模型软件系统方法域模型视图层控制层设计结构基础规则隔离封装

prefix-hash-tree的插入、查找和重构算法

与本文相关的学术论文