基于最大熵模型的冠词错误纠正系统

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:yangyilong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了英语语法中冠词错误的计算机自动纠正.首先对冠词使用的错误进行定义分类,并考虑到可能出现冠词缺失的情况,通过采用基于最大熵模型的分类器,选择包含上下文、上下文词性、短语结构等特征,在训练集上进行模型预的训练,然后使用模型对于输入句子进行预测并纠正存在的使用错误.在NUCLE语料的实验中,给出了语料处理、模型特点、训练语料的大小对于测试集效果的影响,并且比较了自然语言处理中非常通用的朴素贝叶斯模型的结果,还根据英语语法中存在的错误特点对模型进行改进,最后在测试数据达到35.48%的F值,相较于CoNLL
其他文献
视觉词袋模型在基于内容的图像检索中已经得到了广泛应用,传统的视觉词袋模型一般采用SIFT描述子进行特征提取.针对SIFT描述子的高复杂度、特征提取时间较长的缺点,本文提出采用更加快速的二进制特征描述子ORB来对图像进行特征提取,建立视觉词典,用向量间的距离来比较图像的相似性,从而实现图像的快速检索.实验结果表明,本文提出的方法在保持较高鲁棒性的同时,明显高了图像检索的效率.
伴随着软件在当今社会中扮演着日益重要的角色,在各类软件或系统的开发过程中,测试变得越来越重要.随着面向对象技术的广泛应用和软件测试自动化的要求,基于模型的测试(MBT)技术逐渐得到了软件开发和测试人员的认可和接受.尽管有许多国内出版物讨论了基于模型的测试技术,但还没有相关技术文章对MBT技术及工具的当前发展进行回顾与总结.文章对当前MBT技术的通用模型、测试用例生成方法、测试目标选择等MBT方法进
针对现有调度方案中不能解决电器使用的不确定性和可再生能源的问题,提出了一种考虑不确定性的基于实时电价的家用电器任务调度方案,该方案采用线性规划的建模方法,以最小费
分析了语义Web环境中本体的特点和本体管理的功能需求,提出了针对web环境下本体库管理系统体系结构的设计原则,基于该原则设计B/S结构的本体系统.最后,给出了一个遵循该体系
针对目前个人知识管理工具存在的功能单一以及实时性差等缺陷,提出基于智能化移动终端的、敏捷实时的个人知识管理体系结构.通过与传统基于SOA的Web服务进行比较,阐述基于ROA
自适应仿射传播聚类作为一种新兴的聚类算法,不需要指定初始类心以及类数,对解决聚类中类数不确定性问题非常有效.然而,自适应仿射传播聚类存在时间消耗过大的问题,当样本数
传统社区服务体系中存在信息孤岛现象和协作困境.针对这种情况,提出基于技术与组织互构视角的社区事务受理服务系统解决方案.方案首先研讨基于“前台一口受理、后台分工协同
江苏省地震信息网络系统是全省区域地震数据传输、数据交换、数据存储及信息服务的统一平台.针对网络系统目前存在的问题,提出了改造方案,即通过使用隔离网闸将业务传输系统
提出了一种基于组件的虚拟实验室反馈模型.该模型针对虚拟实验室中的实验设备以组件形式实现的特点,把实验流程的拓扑结构以及实验设备的参数转换为有特定含义的字符串,同时
基于Arduino模拟传感器网络跨平台传输系统是由Arduino控制器产生不同的数据模型,并将该数据通过Zig Bee无线传输方式经过业务代理端传至指定服务器存储,网络测试平台通过读