歧义切分与专有名词识别软件研究

来源 :语言文字应用 | 被引量 : 0次 | 上传用户:flyskyxun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语文本的自动分词是汉语信息处理中最为基础的研究,自动分词的分词精度直接制约着其他汉语语言工程项目的进展和水平。歧义字段切分和未登录词(包括专有名词)的识别是自动分词中尚未解决好的两大难题。本文采用语料库方法,从大规模真实文本中提取汉语的各种语言现象,将统计模 The automatic segmentation of Chinese texts is the most basic research in Chinese information processing. The accuracy of word segmentation in automatic segmentation directly limits the progress and level of other Chinese language programs. Ambiguity field segmentation and the unrecognized words (including proper noun) recognition is an unsolved word in the automatic segmentation of the two major problems. This article uses the corpus method to extract various linguistic phenomena of Chinese from large-scale real texts,
其他文献
观看巴西队比赛令人兴奋、过瘾,其流畅的艺术足球使人犹如置身于优美的桑巴舞旋律之中。身高仅1.68米的小个子罗马里奥,就是这优美旋律中的一个高音符。 世界杯赛场上,巴西
ASET, Association of Super-advanced Electronics Technologies, has been taking the initiative in developing EUV lithography technology in Japan for the past thre
期刊
中国电影少数民族题材探索片植根于少数民族地区的生活土壤中,在内容和形式上都具有独特的意义,但也因为没有把握住民族精神的实质而难以得到观众的认同。
我们知道,衣记帐凭证和会计帐簿上都没有“摘要”栏。写好“摘要”是会计核算的一项基础工作。在记帐凭证和会计帐簿上为什么要设置“摘要”栏?这是因为记帐工作中有一项重要要
目前,汉语成语词典出版很多,而其中之佼佼者当推刘洁修编著的《汉语成语考释词典》(下作《考释》,商务印书馆,1989)。它“探索源流,贯通古今”[1],材料翔实,编写严谨,堪为当代汉语成语词典中水
询问义动词“问”在《论语》、《孟子》和《韩非子》中 ,与其所问事件及对象的组合形式有 6种 ,但只有“问 +事件”“问 +对象”和“问 +对象 +事件”三种形式沿用至今。这是
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
你的美,凝集在缓慢的沉思中 而你的重力,系于消逝者 就像那本悲凉的书籍,木与石的碑刻 为往昔虹吸着丰盈的晦暝 作为治疗,风声里,竹树在磨墨 天空的宣纸上,卷积云 反复为时间书写舒
餐饮服务技能的训练是餐饮服务专业课教学全课程的重点,教学过程要遵循标准、亲身体验,引导学生主动探求、钻研教材,要找出规律,应用知识指导实践、模拟情景,要扮演角色、全
歇后语是我国语言中的一种形式,也是人们喜欢运用的一种口头语言。它具有幽默、诙谐、风趣、生动、形象的特点。歇后语同成语的性质很相近,只是歇后语把一个成语的意义分成前后