分词国际标准中的核心概念体系

来源 :第十一届全国民族语言文字信息学术研讨会 | 被引量 : 0次 | 上传用户:zxjds
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文给出了ISO国际标准《语言资源管理:面向单语种和多语种书面语信息处理的分词──第一部分:一般原则与方法》中的核心概念体系,以期征求意见并改进之。
其他文献
传统的维吾尔语文本校对技术都是以庞大的词库、词的出现频率统计方法为主的,有很多的局限性。本文提出了一种音节统计、单词统计和语法规则相结合的,以音节匹配为主要手段的
针对面向查询的多文档自动文摘,本文提出了一种多特征融合的文摘句选择策略。首先通过计算句子与查询在语义层面上的相似度,获取句子与查询的关联特征,然后运用构建的语义网
本论文描述了安多藏语辅音识别系统的设计,特征参数选用LPCC系数。用自相关法计算参数,保证了系统的稳定性,计算量小,易于实现,识别算法采用基于动态时间规整的模板匹配技术,
近年来少数民族语言的语音研究有了长足的进展,在藏语的语音研究方面也有了不少成果。本项目建立了单音节文本库,语音库和声学参数数据库等,并对安多藏语的单音节的声学特征
一九五三年,我们到了抗美援朝的前线。在灾难深重的年代,与英勇的朝鲜人民亲密地会见,这是一生难忘的。我们为朝鲜人民斗争的胜利而高歌,也为朝鲜人民所遭受的侵略而愤慨!时
本研究采用SSR分子标记方法,分析了36份制干辣椒品种资源间的遗传关系。从36对SSR标记中筛选出12对进行电泳分析,这12对引物扩增条带清晰且多态性丰富。分析结果表明:12对SSR
“矿床讲座”从今天起和读者见面了。这时候,北京正在举行全国第一次职工科学技术普及工作极积分子大会,动员职工向科学技术进军。广大职工都在热烈地响应党的号召,努力学习
在自然语言处理研究中,知识表示、知识获取是核心课题。建立知识系统的主要问题就是通常所说的知识的获取和表示。只有对自然语言知识进行高度形式化的充分描述,才可能建市起
会议
導言病理生理学是醫學的基礎理論科學之一,它的任務是研究疾病發生的原因(病因學)、疾病發展過程和歸轉的規律(發病機制),即恢復健康(痊愈機制)和死亡的規律。簡言之,病理生
本文介绍了多语言农业知识处理平台的基本结构,其中遇到的几个基本问题:控件中的民族语言显示问题,语言模型与翻译模型训练问题,翻译通信问题。本文对这几个问题提供了解决方