文本元数据自动抽取算法的研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:Melaniemei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种从科技文献等文档中自动抽取元数据的方法,将自动归纳法和相似特征度算法结合起来,基于特征相似的归纳学习算法自动生成抽取规则,并对文档进行元数据的自动抽取。这种方法利用文档自身某些特有属性,对文档的内容进行分块,利用归纳法自动生成抽取规则,并结合特征相似度对生成规则进行匹配,然后对文档元数据信息进行自动抽取,提高了自动生成规则的效率和抽取元数据信息的准确率。
其他文献
遗传算法是一种优秀的优化算法,但在工程领域及理论研究中要使用它必须深入了解算法并从头编写程序。介绍一种适用于VC++、VB、Delphi等平台的遗传算法通用控件的设计与实现。该控件基于COM技术,通过Microsoft的ActiveX实现,使用户在不了解算法的情况下仅需编写目标函数和少量代码即可方便使用遗传算法进行优化。此外,控件采用了多编码多种群改进遗传算法,增强了控件的适用性,提高了算法的收敛
一 “洪荒造塔语言殊,从此人间要象胥”。 由于多数民族、国家所采用的语言系统不同,使得翻译往往成为人们交际、交流中不可缺少的中介手段。正如法国当代比较文学家伊夫
小麦综合抗病品种研究项目自2008年开展以来,漯河市农业技术推广站和漯河市农科院植保所密切配合,每年从全省已鉴定小麦综合抗病品种中选出10个进行示范推广,研究范围大,年度
随着移动互联网迅猛发展,移动终端的硬件资源如计算能力、存储能力及电池续航能力等等,已严重制约了移动互联网的发展。针对移动终端存储能力不足问题,结合目前集群技术及云存储技术,考虑到移动终端文件主要以小文件为主,提出一种基于云存储的移动终端网络存储模型,其体型结构包括基础设施层、基础管理层、应用接口层和访问层四部分,把信息的存储和处理移植到云上,从而为解决移动终端资源受限提供一种可行方案。