条件随机域相关论文
条件概率模型,又称为判别式模型(Discriminative Model),是一类常用的模式识别方法,它相对于产生式模型有很多优点。产生式模型早期被广......
随着近代计算机技术的飞速发展,孤立词语音识别系统已经取得了较高的识别准确率,非特定人、大词表连续语音识别技术成为当前的研究......
随着信息技术的发展,不同语言之间的沟通和交流变得越来越重要,在此背景下机器翻译等自然语言处理技术得到长足发展。作为当前研究......
随着互联网资源的迅速增长,仅仅依靠浏览器以及基于关键字检索查询的搜索引擎,已远不能满足互联网用户的信息需求,Web信息抽取应运......
中文分词是中文自然语言处理的基础性任务,分词的准确性直接影响到后续处理任务,分词的速度影响到后续的直接应用。成功的分词方法......
随着社会和信息网络的发展,自然语言处理变得越来越重要。完全句法分析是自然语言处理的一个重点和难点,于是人们提出一种浅层句法......
文本分类是基于文本内容将待定文本划分到一个或多个预先定义的类中的方法。文本分类能较好地解决大量文档信息归类的问题并可以应......
随着人工智能技术在电力行业的应用,知识图谱将在电网调度、智能运检、客服问答等领域发挥重要的作用.实体识别是构建电力知识图谱......
提出一种新的基于条件随机域和隐马尔可夫模型(HMM)的人类动作识别方法——HMCRF。目前已有的动作识别方法均使用隐马尔可夫模型及......
首次把条件随机域(CRF)模型应用到了中文名实体识别中,且根据中文的特点,定义了多种特征模板。同时,为了解决长距离约束问题,将词语触发......
提出一种基于条件随机域模型的方法用于中文文本组块分析.该方法将中文组块分析转化为对每个词语赋予一个组块标注符号,再根据条件随......
通过加入噪声、替代文字等手段隐藏信息内容的真实符号分布,是目前垃圾制造者干扰或躲避过滤器检测的主要手段。介绍一种使用基于......
信息抽取中,同一token在文本中可能出现多次,且token多次出现的位置通常相隔很远,传统线性链CRF模型由于Markov假设不能表达长距离......
介绍了使用机器学习方法进行生物医学文本命名实体识别的技术,包括Generalized Winnow算法、支持向量机方法和条件随机域模型.根据......
目前在国内外语篇级情感计算的研究刚刚起步.首先按表达情感的复杂度将句子划分为单情感词的简单句、多情感词的简单句和多情感词......
针对当前车辆检测方法中存在难以有效消除阴影干扰的缺点,提出了一种能够消除阴影干扰的车辆区域检测方法。该算法首先运用选择性......
论述了近年来国内外在常规命名实体识别方面研究工作的进展状况,针对其中最为关键的产品命名实体识别技术,考虑到领域本体对产品命......
鉴于生物医学命名实体识别的多数模型使用单机器学习算法时识别效果不好,提出一种基于条件随机域(CRFs)与最大熵(Maxent)分类器融合的......
分析了判别式模型的标记偏置问题对序列化标记的影响,利用条件随机域模型的全序列概率归一思想解决标记偏置问题。在条件随机域模......
提出了一种新的基于膜粒子群优化的特征选择方法.该方法利用了膜系统的分层结构和消息传递机制,将粒子群优化算法作为区域子算法部署......
介绍一个用于在生物医学文献中识别基因、蛋白质等生物实体的识别方法。该方法基于条件随机域方法,选取适当特征进行实体识别,利用......
基于编辑距离和多种后处理的生物医学文献实体名识别方法通过"全称缩写对识别算法"扩充词典,利用编辑距离算法提高识别召回率。在......
随着互联网的普及应用,网上各种垃圾信息尤其是垃圾邮件也随着互联网的广泛应用而充塞在整个互联网上,对人们的工作生活和经济带来......
识别句子中的最长名词短语是一个对机器翻译等任务具有重要实际价值的难题.为了克服传统方法在处理词之间的长程关联的不足和标注......
为了抽取文本中的信息,在分析对比了4种统计建模原型后,选用条件随机域CRY建立抽取模型,提出了一种文本信息抽取的方法。该方法对文本......
为克服传统的全监督机器学习模型的训练依赖于大量的标注样本的弱点,给出一种半监督学习和主动学习相结合的算法。根据主动学习选择......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
近年来,随着生物医学文本的大规模出现,对文本进行自动化处理的文本挖掘技术变得越来越重要,如对海量生物医学文本数据进行自动分类,......
情感计算是目前人工智能领域的热门课题,而词汇的情感计算又是准确完成文本情感计算的基础.目前情感词汇的获取大多采用人工获取的......
传统的分步骤事件抽取方法中,事件元素识别的结果无法指导事件类型识别,而事件类型识别的效果在很大程度上决定了事件抽取系统的整......
随着基于统计技术的自然语言处理方法的兴起,怎样在语料规模有限的情况下,尽可能的提高系统的效果就显得十分重要。以下主要介绍两种......
提出一种基于条件随机域模型的生物命名实体识别方法,结合单词构词特性以及距离依赖特性,在JNLPBA的GENIAV3.02数据上进行实验,测......
将条件随机域(Conditional Random Fields,CRFs)理论引入网络入侵检测研究中,并结合网络连接数据序列的属性特征,提出一种基于属性......
词性标注主要面临兼类词消歧以及未知词标注的难题,传统隐马尔科夫方法不易融合新特征,而最大熵马尔科夫模型存在标注偏置等问题。......
中文新词识别是指从未标注文本语料中抽取新词并识别其属性的过程,是中文信息处理领域的一项基础任务,其识别结果直接影响着分词、......
基因命名实体识别是在分子生物学及医学领域对基因、RNA、DNA蛋白质等专业词汇进行识别和分类。海量的生物医学文献为挖掘文本中的......
情感计算是人工智能的一个热门研究领域,它的目标是使计算机拥有情感,能够像人一样自然亲切的交流。随着Internet的发展,以文本形式出......
随着互联网的飞速发展,其上的信息越来越丰富,成为人们获取所需信息的主要手段。人们可以将自己的言论信息通过互联网展现出来,比......
中文命名实体(Named Entity,NE)识别是指识别出文本中特定的实体。它是信息抽取、机器翻译、自动问答等多种自然语言处理技术的基......
命名实体识别就是把文本中出现的命名实体包括人名、地名、组织机构名、日期、时间、和其他实体识别出来并加以归类。命名实体识别......
比较是一种具有一定说服力的评估方式,利用机器进行比较句的识别以及比较关系的抽取可以对观点挖掘、信息推荐等应用提供重要的依据......
模糊限制信息检测用于区分模糊限制信息与事实信息,提高抽取信息的真实性和可靠性。模糊限制信息范围的界定具有依赖于语义和句法......
期刊
采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规......