基于中文文本的同义词提取方法研究

来源 :现代计算机 | 被引量 : 0次 | 上传用户:vict1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于自然语言处理技术的快速发展,同义词替换技术已成为文本隐写的重要技术之一。同义词分布在中文文本中具有两个主要的特征:基于特定句子模式的特征和基于相似上下文的特征。而现有的方法只考虑其中一个同义词提取特征,忽略它们之间的互补性,导致同义词在中文本中提取的准确率和查全率较低。提出一种新的提取模型,该模型将以上两个特征结合起来,并针对句子模式的特征,采用词向量和信息熵来提取模式中的提示词;针对上下文的特征,利用TF-IDF对余弦相似度加权的方法来提取实体同义词。实验结果表明,该方法在查全率和准确率上有明显提高
其他文献
伴随高职院校智慧校园建设的推进,尤其是高校最多跑一次改革的进行,网上办事大厅的建设已成为各高职院校信息化建设的重头戏。高职院校相对本科院校规模较小,但各职能部门之
甘草作为一味传统的中药,具有悠久的临床应用历史.甘草酸作为其主要活性成分,具有多重生物活性,包括抗炎、保肝、免疫调节、抗病毒和抗癌等药理作用.随着现代分子化学和纳米
株洲市职教城高职院校拥有服务区域经济得天独厚的优势,将区域高职营销实训课程从区域企业入手,建立服务区域经济发展的营销类实训模式,实现营销信息高度整合共享向服务地方
针对盲解调工作中调制识别部分在低信噪比下识别率不高的问题,利用高阶累积量与BP神经网络的方法进行低信噪比下的调制识别,该方法利用3个高阶累积量C 40、C 42、C 21构造出
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
本文以促进高职院校学生成长成才为目的,以民族传统文化在第二课堂的传承为研究内容,探索如何在第二课堂的建设中,以民族优秀传统文化为载体,使思想政治教育与民族精神培育有
该文以上海市为例,梳理了城市轨道交通运营发展现状和运营安全风险源,从管理环节、信息化手段、体制机制、标准规范等方面,提出轨道交通运营安全风险的事前管控对策。
临床资料患者男,24岁。因发热咳嗽4天、恶心呕吐2天于2007年5月24日入住我院血液科。入院前4天出现发热(39~40℃)、阵发性轻度咳嗽伴少量稀薄白色痰液,于当地医院静脉点滴抗生素及
家族性良性慢性天疱疮(benign familial chronic pemphigus)又称为Hailey—Hailey病,是一种少见的遗传性皮肤病。现将我们所见的1例报道如下。