基于提取关键词的中文文档复制检测研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:donggewo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档复制检测技术在保护知识产权和信息索引中起重要作用,它可以防止剽窃事件的发生,提高互联网检索效率。目前,英文复制检测技术已经比较成熟,但中文复制检测技术研究还处于起步阶段。本文提出一种基于关键词的指纹提取方法;提出k-words方法分解句子;定义了数字指纹树概念,并用数字指纹树来存储指纹。最后,用实验验证了所提出的方法。
其他文献
Exception是一类特殊的对象,它在Java方法出错时被创建,并利用try/catch/finally机制抛出、处理异常.本文提出了一种合理的新方法,在系统依赖图中表示异常处理模块,利用图可
互联网时代的到来,为教育改革提供了发展机会。MOOC在线教育平台实现了"互联网+教育",SPOC是在MOOC的基础上开发的小型在线课程,实现了将传统课堂和在线课程相结合。文章以会
金融犯罪一般和账户的资金流动有着紧密的关系,特别是在洗钱活动中表现得尤为突出。目前,大多数的异常侦测系统采用的是传统知识发现方法,首先对数据集进行调查,形成感兴趣的
男,汉族,1956年5月生于贵州,祖籍山西太原。1985年毕业于西南师范大学美术系,1986年结业于中央美术学院版画系。现为贵州民族大学美术学院院长、教授、硕士生导师。中国美术家协
期刊
本文提出了一种优化路由算法的方案,通过在网络节点配置蚂蚁数目控制表来控制“网络蚂蚁”的数目。这样能够根据网络状况设置合适的蚁群规模,从而可以使网络达到更好的负载平
建模仿真是研究集成服务模型的最好手段之一.论文介绍了集成服务模型体系下RSVP信令的工作机制以及协议结构的设计与实现.在OPNET仿真环境下设计了集成服务原型系统并研究了
影响移动代理技术推广的主要因素在于安全性、效率和标准,其中安全性是一个主要因素.移动代理安全性体现在移动代理机密数据的保护、移动代理和移动代理执行平台的验证等.目
目的观察微RNA-346(miR-346)对食管癌细胞生物学行为的影响,并探讨其分子机制。方法通过实时荧光定量PCR(q PCR)检测食管癌组织和细胞株miR-346的表达量。以表达量最低的细胞
加强会计职业道德建设,应从指导思想入手,提高会计工作人员的思想政治水平,并且进行相关职业道德的强化与培训教育。
802.11 MAC协议在负载较高的情况下,由于大量节点对信道的竞争导致的冲突使得系统吞吐量迅速下降,于是双阶段竞争方式MAC协议被学者提出.它将竞争阶段一分为二,只有完成竞争