印尼语、马来语自然语言处理研究综述

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:guosl1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着印尼语、马来语互联网普及率的上升,对海量印尼语、马来语文本进行信息处理存在重大需求.虽然研究人员对印尼语、马来语展开较广泛的研究,但是作为低资源语言,受到的关注远不及通用语,未能较好利用前沿的深度学习方法.文中梳理总结包括词法分析、句法分析、机器翻译、拼写检查等印尼语、马来语相关的自然语言处理技术.对比分析相关的研究成果发现,大多数研究因语料规模及评测标准不同难以客观对比各种算法的差异.最后结合印尼语、马来语现有的各领域语言资源开放情况,指出印尼语、马来语的自然语言处理研究面临的问题,并展望未来发展趋
其他文献
在基于犹豫模糊距离的多属性决策问题中,定义距离测度和计算属性权重是两个关键点.在定义犹豫模糊数的距离测度时,针对添加相同元素,补齐较短犹豫模糊数,改变原有含义的问题,
目的为了进一步提高临床护理教学质量,探索性格因素在一对一带教模式中的影响。方法将2002年6月~2003年12月来妇产科实习的护生87人,根据性格进行配对带教,分4组型带教。护生
遵照集团公司工作方针及精神,我们部门在一季度全面组织学习了《成本管理制度》及《工程建设项目成本作业程序与规则》.通过本次学习,使我们成本工作者更加明确了工程成本工
基于k近邻的标签噪声过滤对近邻参数k的选取较敏感.针对此问题,文中提出近邻感知的标签噪声过滤算法,可有效解决二分类数据集的类内标签噪声的问题.算法分开考虑正类样本和负
在多尺度决策信息系统中,一个条件属性对应某个尺度构成论域的一个划分.文中把相应的划分推广为覆盖,并建立多尺度覆盖决策信息系统模型(MSCDS).为了简化系统复杂信息的表达,
文章对动态业务模型下的稀疏波长变换网络性能进行了分析与研究,对波分复用(WDM)网络中引入波长变换器后的网络性能进行了系统的仿真,分析了波长变换器数量、波长变换器位置
本文以建筑给排水系统设计为研究视角,针对给排水系统设计中水泵的选用展开分析讨论。从水泵选择的基本原则出发,探讨给水泵、排水泵、消防泵的选用要点,以及水泵工况的设计
概念格理论与方法是形式概念分析研究中的基本内容,该研究已取得一系列的重要成果,主要集中在概念格模型推广、概念格构造、概念格约简、基于概念格的规则提取、概念知识空间