基于词典词语量化关系的中文文本分割方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:yahoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet网络资源的快速膨胀,海量的非结构化文本处理任务成为巨大的挑战。文本分割作为文本处理的一个重要的预处理步骤,其性能的优劣直接影响信息检索、文本摘要和问答系统等其他任务处理的效果。针对文本分割中需要解决的主题相关性度量和边界划分策略两个根本问题,提出了一种基于词典词语量化关系的句子间相关性度量方法,并建立了一个计算句子之间的间隔点分隔值的数学模型,以实现基于句子层次的中文文本分割。通过三组选自国家汉语语料库的测试语料的实验表明,该方法识别分割边界的平均错误概率^-Pk和最低值均好于现有的其
其他文献
江岸区是武汉市委、市政府及市级各大机关的所在地,也是武汉各大城区中人口密度最集中的地区之一,因此,提供一方良好的安居环境十
期刊
实验素描与传统素描相比更强调作品的形式感、视觉表达方式、观念性以及创意性,是对传统素描形式的延伸和拓展。针对实验素描课程的教学研究,在策略方法上应重点依托绘画材料
提出一种基于BoostingRBF神经网络的人体行为识别方法,该方法利用规范化的运动历史图像(MHI)进行图像序列表示,从中提取Zernike矩的统计描述特征,然后提出Adaboost算法自适应地选择图像序列的特征作为RBF神经网络的输入,为了进一步提高神经网络的泛化能力,采用一种调整权值分布,限制权重扩张的改进的Boosting方法,分类器以加权投票方式进行分类决策。实验结果表明,提出的方法能够
学生社团是大学生基于共同的兴趣、爱好、志向等因素自发形成的群众组织,是开展大学生思想政治教育工作、丰富校园文化的重要阵地。春雷话剧社作为实践样本,探索其成立18年来
精神生产力是精神力(人类精神在人类非产业活动中所显示的力量)的产业化,精神生产力是人类在生产精神产品时的产业力量,它是与物质生产力和管理生产力相区别的一种社会生产力
期刊
我们认为和谐的政治文化就是根据中国的政治现状,在建设和谐社会的过程中,培育、构建一个主流政治信仰坚定,公民积极参与社会政治,民主法制意识明确,平等、文明之风盛行的政
期刊
教育部41号令《普通高等学校学生管理规定》(以下简称《规定》),是新形势下指导和规范高校学生教育管理工作的重要规章和政策依据,必将对我省高校学生教育管理的科学化、制度化和规范化产生巨大推动作用,也必将有力推进我省高校学生教育管理工作新模式的创新。  铸魂养德 弘扬传统文化,润泽学生心灵  党的十八大报告指出:“文化是民族的血脉,是人民的精神家园”,没有文化的积极引领,就没有精神力量的充分发挥。《规
提出了一种基于提升算法的低功耗并行的二维离散小波变换的VLSI结构。提出结构的同时进行行和列方向的处理,不需要额外的缓存来存储用于列变换的中间变换系数。通过分时复用关
阳新,是闻名全省的打工大县,劳务经济是县域经济的重要支柱。近年来,县委、县政府以充分就业为目标,以扶持创业为切入点,解放思想,与时俱进,立足县情,因势利导,从而催生了全
期刊
一个政党要站在时代前列,一刻也不能没有理论思维。面对新世纪新阶段新任务,以胡锦涛同志为总书记的党中央适时地提出了科学发展观的重大战略思想。胡锦涛总书记在党的十七大报
期刊