不规则文本中商品名称识别的特征选择

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:firemourne
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的命名实体识别任务多见于人名、地名、机构名这些普通的命名实体,且大多采用规则文本进行研究.随着电子商务和互联网广告的不断发展,如何从用户的各种不规则的上下文信息中自动识别出商品名称这一特殊的命名实体成为了一个需要解决的问题.为了解决这一问题,建立了一个最大熵模型用于识别论坛发帖这种不规则文本中的商品名称,并探讨了多种特征对于识别效果的影响.这些特征不仅包括传统命名实体识别方法中所使用的局部特征和布朗聚类特征,还包括词的分布式表示这种比较新颖的特征.这些特征按照各种不同的方式进行组合作为模型的输入.在C
其他文献
蒙古语在命名实体识别方面开展过人名的识别,但在地名的识别方面还没有开展相应的研究。首次实现了基于条件随机场模型的蒙古文地名识别。首先从蒙古语黏着性特点分析入手,研
一篇文章包含着作者的思想和情感,只有在相应的情境中,学生才可能真正体会到深层次的含义和饱含的深情。情境教学可以促进学生语文素养的培养,进而促进学生整体素质的提高,小学语
装车站运输作业的时间可靠性程度直接关系到货达时间可靠性。在“实货”运输的背景下,对装车站运输作业的时间可靠性的研究至关重要。详细分析了装车站运输作业具体过程,建立
新中国成立70年以来,东北农业大学坚持"立德树人",用"艰苦奋斗、自强不息"的东农精神铸造了不朽的东农校魂,陶冶了代代东农学子,培养了大批服务国家经济社会发展的优秀人才。
采用木醋废液调质石灰石,并在热重分析(thermogravimetric analysis,TGA)仪上对调质产物的热解特性进行研究。X射线衍射结果表明,木醋调质石灰石的主要成分为水合醋酸钙,其热
为了简化构造组合曲线时,相邻曲线的控制顶点间应满足的光滑拼接条件,构造了一种结构类似于二次Bézier曲线的含参数的双曲型曲线,称之为H-Bézier曲线.该曲线具有B&
检察机关公益诉讼以保护国家利益和社会公共利益为根本目的,在公益诉讼如火如荼开展之际,行政公益诉讼诉前调查利益受损状况如何、相关单位整改情况是否到位、提起诉讼的标准
复杂的大规模并行计算机系统需要能客观反映系统性能的测评方法,单个指标难以全面评价系统的性能特点。从用户需求出发,给出了大规模并行计算机系统用户适用性概念,利用适用性概
几乎所有的H R都头疼招人这件事,似乎总难以找到满意的人才,但事实却是那些不那么令人满意的人还在源源不断地进入公司,又流出公司,再有一批新的进入公司,不断往复成为了一个
随着学生能力的提升,他们往往会变得过分自信。在学习过程中,他们会依据自己的认知对学习内容进行筛选。如到了高中学段,很多学生都觉得自己已经拥有了丰富的学习经验。他们可以