【摘 要】
:
词汇语义网是以词义与语义关系作为基本组织结构的语言知识表示库,它在语义资源建设与进一步语义分析具有重要意义。本文在维吾尔语信息处理的发展现状和语料库语言学的基础知识基础上,以自动转换与人工干预相结合的方法来构造现代维吾尔语名词词汇语义网,使其能够应用于现代维吾尔语词汇语义查询及机器翻译等应用领域。本文从以下几个方面进行了维吾尔语名词词汇语义网研究:(1)首先以《现代维吾尔语语义信息词典》的名词分库
【基金项目】
:
国家自然科学基金项目(项目编号:No.61662081); 国家社科基金重点项目(项目编号:14AZD11); 国家语委重点项目(项目编号:ZD1135-28); 自治区青年科技创新人才培养工程青年博士科技人才项目(QN2016BS0365); 新疆维吾尔自治区社会科学基金(项目编号:2016CYY067); 国家语言资源监测与研究中心少数民族语言分中心项目(项目编号:NMLR201602)
论文部分内容阅读
词汇语义网是以词义与语义关系作为基本组织结构的语言知识表示库,它在语义资源建设与进一步语义分析具有重要意义。本文在维吾尔语信息处理的发展现状和语料库语言学的基础知识基础上,以自动转换与人工干预相结合的方法来构造现代维吾尔语名词词汇语义网,使其能够应用于现代维吾尔语词汇语义查询及机器翻译等应用领域。本文从以下几个方面进行了维吾尔语名词词汇语义网研究:(1)首先以《现代维吾尔语语义信息词典》的名词分库、《现代维吾尔语近义词词典》中的名词部分及《现代维吾尔语语法》中的名词部分为主要研究对象,建立了与Word Net词汇概念兼容的现代维吾尔语名词同义词集合。(2)以现代维吾尔语名词同义词集为组织单位,从Word Net移植名词语义关系,再利用《现代维吾尔语近义词小词典》、《现代维吾尔语词典》等现代维吾尔语各类语义知识库进行妥当调整修改,逐步生成符合现代维吾尔语自身特点的词汇语义关系数据库。(3)结合计算机数据库技术和Web程序开发技术实现了现代维吾尔语名词词汇语义网的查询平台。基于此平台,系统快速、有效地给用户提供了现代维吾尔语词汇语义信息查询应用。此外,本文设计并实现了语义关系数据库的维护功能,从而解决了维吾尔语名词词汇语义关系数据库的动态更新的问题。(4)提出了基于维吾尔语名词词汇语义网的名词歧义消解算法,介绍了基于语料库的同形词和同形词的消歧方法,以及通过消歧实验,验证了名词词汇语义网在此应用的可行性。
其他文献
徽州地区传统民居建筑彩画是我国古代建筑领域的重要构成要素,具有悠久的历史,在传统建筑中有着重要的历史地位。徽州地区传统民居建筑彩画装饰艺术经历了历史的变革,显现了浓郁的当地特征,奠定了徽州地区人们细腻的思想感情。在徽州的民宅、祠堂、庙会、廊架、戏台、亭院、阁楼等诸多建筑分类中经常能出现彩画的图案,并且彩画分布较为广阔,各有不同,以徽州地区为例,建筑色彩主要体现在多个建筑构件之上,如书院、祠堂等,同
当前初中阶段的时政教育关键在于不断创新,其动力、活力也在于谋求创新。面对网络所具有的平等交互、实时共联共享、信息量大等优势,一线学校需要及时开拓时政教育的新领域、新形式,加快初中时政教育网络平台、终端建设进程,加速课堂由抽象说教向形象感化转变,推动时政教育由单面被动灌输向双向互动转变,以实现网络与时政教育的紧密融合。同时,随着中考改革的不断推进,初中阶段的道德与法治课程与时政教育正在逐渐贴合,该课
本文从需求端的角度研究了理财建议对城镇家庭金融资产配置的影响。一方面,改革开放后国内经济持续高速发展使得人民的生活水平持续提高,家庭部门在财富的积累和保值增值上的关注度逐渐提高;与此同时,我国金融市场的不断发展所带来的金融产品种类日趋多样化、结构日趋复杂化的趋势以及提供相关专业知识的理财顾问业务的出现与发展,都为论题的提出提供了历史和发展趋势上的背景。另一方面,在新冠肺炎疫情影响下,全球经济不景气
国家认同对于构建和谐社会、维护社会稳定和促进国家发展有着重要的意义,而媒介作为传播文化、价值观的重要渠道,在国家认同的建构中扮演着重要的角色。但随着社会转型期的加速,代际之间价值观的差异凸显,社会矛盾加剧。同时全球化的逐步深入所带来的各种多元文化思潮在全世界范围涌动,也使得国家认同面临着巨大的危机与挑战。本文从代际差异视角出发,探讨媒介使用对国家认同的影响,以寻求提高不同代际国家认同的有效传播方式
随着通信技术的不断发展,表情符号成为人们在社交平台上与他人进行沟通交流的常用沟通方式。由于目前传递表情符号这类信息的信息型学术文本较少,翻译界对该类文本的翻译研究还不充分,因此,加强对该类文本的翻译研究,传播更多表情符号相关知识,促进以信息性为主导功能的学术文本的翻译研究势在必行。笔者选取指向性较强的学术文本,即由语言专家维维安·埃文斯(Vyvyan Evans)创作的《表情符号代码》(The E
现代汉语中的被动句可以分为两种类型:一种是有形式标记“被”、“叫”、“让”等的有标记被动句,以“被”字句为代表,另一种是没有这些形式的无标记被动句。相比于有标记被动句,无标记被动句在口语中出现的频率要更高一些,留学生在该句式的学习和使用上经常会出现偏误。但当前,在对外汉语教学和二语习得领域,更多的是关于有标记被动句,尤其是“被”字句的习得与教学研究,专门针对无标记被动句习得与教学研究的成果非常少见
核心素养是现今教育领域关注的焦点,国家教育部于2018年1月颁布《普通高中美术课程标准(2017年版)》,“美术学科核心素养”应运而生,这势必对高中美术教学产生影响。它强调美术教学更以问题为导向,更关注学生生活,更提倡地域文化资源开发,更关注时代发展。美术课程资源开发一直备受关注,《普通高中美术课程标准(2017年版)》再次提到开发利用地域资源,鼓励教师根据当地美术教学资源来开发具有鲜明地域特色的
当上市公司的财务状况不能满足于证监会对其的要求时,为了保护投资者,就会在股票代码前加上ST来将它和经营状况良好的上市公司分别开,从而对投资者负责。这样就会使一些难以通过自身正常经营来扭亏转盈的ST公司产生了业绩调整的动机,以掩饰不良经营状况,从而免于退市。由于我国在资本市场监管领域的规定起步较晚,规定也相对宽松,一些ST公司有动机利用制度空隙,通过会计造假调节利润,以规避监管。我国现有研究主要集中
随着资本市场的日益发展,近年来国内企业IPO需求爆发,我国A股市场新股破发的浪潮愈演愈烈,新股破发也成为了证券市场中最受关注的话题之一。新股的破发不仅打破了“打新”的超高回报的不败神话,还为我国证券市场的长久发展带来了更多挑战。“三高”现象在创业板中较为常见,这些因素也在不断影响并促进主板市场中大面积的新股破发。因此,本文旨在新股破发创新高的大背景下,通过A股市场中渝农商行的破发典型性案例对新股上
近年来,随着云计算技术的发展,用户存储在云服务器上的数据日益增多,同时也增加了数据泄露的风险,这给云计算带来了巨大的挑战,如何对这些数据进行安全地计算成为人们研究的热点。全同态加密的出现为上述问题提供了一个良好的解决方案,全同态加密是一类特殊的加密方案,它的一个显著特征就是允许任何人对密文直接进行计算操作,其解密结果等于对明文做同样的计算操作,避免了数据泄露的风险。但传统的大多数全同态加密体制仅支