【摘 要】
:
市场信息化使得商务信息抽取、市场内容管理日益成为信息科学领域的一个研究热点。产品命名实体识别作为其中非常重要的关键技术之一也逐渐受到人们的关注。本文面向商务信息
【机 构】
:
中国科学院自动化研究所模式识别国家重点实验室,富士通研究开发中心有限公司
【基金项目】
:
国家自然科学基金资助项目(60372016);北京市自然科学基金资助项目(4052027)
论文部分内容阅读
市场信息化使得商务信息抽取、市场内容管理日益成为信息科学领域的一个研究热点。产品命名实体识别作为其中非常重要的关键技术之一也逐渐受到人们的关注。本文面向商务信息抽取对产品命名实体进行了定义并系统分析了其识别任务的特点和难点,提出了一种基于层级隐马尔可夫模型(hierarchical hid-den Markov model)的产品命名实体识别方法,实现了汉语自由文本中产品命名实体识别和标注的原型系统。实验表明,该系统在电子数码和手机领域均取得了令人满意的实验结果,对产品名实体、产品型号实体、产品品牌实体整体识别性能的F值分别为79.7%,86.9%,75.8%。通过和最大熵模型相比较,验证了HHMM对于处理多尺度嵌套序列有更强的表征能力。
其他文献
文章从提高图书馆读者服务质量,避免或化解与读者的隔阂和冲突,展现馆员个人素质与文化修养,体现图书馆人性化服务等方面论述了文明礼貌用语在图书馆读者服务中的作用。
碱蓬属(Suaeda)植物是一类典型的真盐生植物,属于重要的盐生植物资源,全球广泛分布。人们已经对20种碱蓬属植物进行了观察和盐胁迫实验,研究了不同器官或组织的生理生化特征
实体关系抽取是信息抽取研究领域中的重要研究课题.本文使用两种基于特征向量的机器学习算法,Winnow和支持向量机(SVM),在2004年ACE(Automatic Content Extraction)评测的训
通过分析2003—2006年连续3个冬季北京城区和城郊越冬长耳鸮的食团,研究了长耳鸮食物组成的时间与空间变化特征。每月收集1次长耳鸮食团,通过其内容物分析长耳鸮食物中的猎物
先秦时期神荼郁垒已作为有史可考的门神现身于门户。汉代以降 ,武士形象进入门神行列 ,与神荼郁垒分庭抗礼。迄于元明 ,小说人物纷纷充任门神 ,门神面目因之纷繁多样。时至今
<正> 由刘广生主编的《中国古代邮驿史》将由人民邮电出版社出版。本书从原始公社的通信活动谈起,按每个历史朝代,分别叙述了中国古代邮驿的发展情况。内容分为十一章,九十节
采用问卷调查和文献资料相结合的研究方法 ,对上海市民家庭体育消费水平、体育消费结构等方面的现状 ,进行了分析。结果显示 ,体育消费正成为大多数上海市民家庭生活消费的一
目的:利用文本挖掘技术探索中成药及西药治疗慢性前列腺炎的用药规律。方法:在中国生物医学文献数据库(CBM)中采集治疗慢性前列腺炎的相关文献,建立Access数据库,运用SQL对数
<正>赵华的儿童文学创作全部以童话文体来命名,想必他本人对此一定有过自觉深入的思考。他坚持认定自己作品的精神特质在童话,这很值得我们琢磨与分析。童话是最能体现儿童文
<正>运动员在平时要多喝些牛奶,这是由于牛奶的营养丰富,能弥补运动员运动中所损失的某些营养物质。不过牛奶中究竟有什么营养物质呢?