数理语言学相关论文
本文构建了一种三特征流混合动态贝叶斯网络(T_AsyDBN)听视觉情感识别模型,听觉流采用MFCC特征和经过PCA降维的局部韵律特征,视觉流定......
互联网上音频数据量的激增,使音频内容拷贝检测 渐成为热点。本文选取频带能量差异做特征设计了一个基于指纹索引的快速音频拷贝检......
作文是汉语考试的必考项目,寻找简单有效的作文自动评分算法无疑可以很大地提高作文阅卷的效率。本文在词汇等级方面研究作文自动评......
基于加权有限状态转换器的语音解码技术是当前语音识别领域的研究热点之一。利用加权有限状态转换器的相 关理论和算法,可以构建语......
本文提出了一种基于声学模型Viterbi解码的中文合成音库韵律短语边界自动标注方法,以降低大语料库单元 拼接合成系统的构建成本。该......
研究表明,基于隐马尔可夫模型的语音合成(HMM-based speech synthesis)中结合整体方差(Global variance, GV)模型的参数生成方法对......
为获得具有通用性的声调处理系统,本文运用计算语言学方法,基于管辖音系学理论提出跨语言声调处理算法。经分析天津话和丹阳话变调算......
传统基于线性预测(LP)声码器采用简单的脉冲加白噪声激励模型,合成语音有严重的机器声。为了提高传统线 性预测声码器的合成音质,本......
压缩感知(compressive sensing,CS)是一种基于信号稀疏性的采样方法,可以有效提取信号中所包含的信 息。本文提出了一种基于CS过程的语......
帧规整对数后验概率是目前公认最有效的发音质量的度量。本文证明了该度量反映了当前发音对应的声学模型 与概率空间中声学模型的......
本文提出了一种基于主动外观模型(AAM)特征和异步发音特征DBN模型(AF_AVDBN)的逼真可视语音合成方法。在 AF_AVDBN模型中,发音特征(......
平行网页文本中除了互为对照的内容,还存在一些无关的噪声,因此利用网页结构相似的方法解决平行网页中句对齐问题受到一定的限制。通......
现有的计算机辅助语言学习系统(Computer Assisted Language Learning,CALL)在得到GOP分数之后,对所有的音素都使用相同的映射函数计算......
本文提出了一种基于层叠条件随机场的CFN句法语义自动标往方法。该方法在低层条件随机场模型中解决了框架元素的识别,将识别结果传......
本文研究了基于基本块信息使用条件随机场模型(CRF)对汉语功能块进行自动标注的问题,针对词和基本块的两种不同的标注策略,将汉语基......
本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法。首先使用条件随机场模型进行标注识别,再结合最长名词短语的边......
在汉语NP自动分析中,名词和量词的搭配问题是难点。本文在HPSG理论框架下,构建了汉语NP的形式化模型,并分析了该模型在LKB系统中的......
本文基于山两大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构造了词层面以及句法层面共计35个......
汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的比喻标志(比喻词),成为一种较理想的用于计算机自动处理的比喻类型。本文着......
本文统计和分析了有标记联合结构内部和外部的语言学特征,内部特征方面主要考察了联合结构的词性序列分布、短语序列分布。外部特......
本文利用依存关系进行语义角色的标注,在CONLL2008提供的shared task语料库上进行训练和测试,经过相关剪枝算法处理以后,使用最大熵......
本文实现了一个基于机器学习的指代消解平台。在此基础上,通过自动语义角色标注工具得到目标动词和语义角色信息,组合语义角色特征......
本文针对互连网上近似镜像网页严重降低搜索引擎效率的现象,提出了一种去重的方法。该方法通过句子在文中的位置和组块的重要度,提......
本文将古文对联规则区分为硬规则与软规则,用软规则指导建立对联应对的有向概率图模型,使用EM算法估计模型参数,在解的搜索过程中......
本文根据垃圾博客和正常博客在内容特征上的差异,对多种针对博客分类有效的统计特征进行了分析,提出了基于博客内容统计特征的过滤......
本文利用K-最近距离的方法对哈萨克语报纸进行分类,初步实现了利用统计词频信息和语言信息相结合的方法选择特征词,且计算特征的权......
互联刚金融信息对于金融市场的影响在当代已经越来越不可忽视.面对海量的信息,其中大部分为非结构化的文本数据。本文结合目前已有......
查询扩展是信息检索中关键问题之一,查询扩展的有效性决定其检索性能。用户查询日志是大量用户长期查询行为的记录,通过挖掘用户查......
本文在汉语框架语义知识库的基础上,利用语义WEB语言,通过汉语框架语义知识库对问题进行语义分析,并利用旅游本体知识库对答案进行......
在Google应用中使用的语言模型与其公开的Web 1T 5-gram库有很大不同,一个根本的差异体现在是否忽略标点符号。本文以谷歌拼音输入......
全自动的语义分析一直是自然语言理解的主要目标之一。通过深层语义分析,可以将自然语言转化为形式语言,从而使计算机能够与人类无......
本文以实词作为特征,采用Na(i)ve Bayes和最大熵分类模型进行主客观句子的判别。在公开的评测语料MPQA上实验结果显示:Na(i)ve Brdy......
冠词选择需要综合考虑语言知识、语义知识以及世界知识,是汉英翻译中的一个难点。本文针对传统的基于规则和机器学习的方法只考虑......
如何让计算机根据自然语言的语义表示消解句子乃至段落篇章中的人称代词,一直是自然语言处理的一大难题。本文依据HNC理论的句类表......
本文在阐述多字词表达式的定义的基础上,对面向特定领域的多字词表达式提取的技术路线进行了详细说明,并在方法、面向对象规模、效......
本文主要介绍一个语篇标注体系,该标注体系采用自底向上的方法对基本语篇形式单元(BFDU)到句群等语篇中不同层次的语言单位和其间......
本文提出了一种从句对齐语料中抽取出词语对齐的新颖方法。文章比较了主流的词语对齐方法,分析了IBM模型,发现模型在挑选最佳对齐......
基于层次短语的统计机器翻译模型是近年来比较流行且翻译质量较好的一种模型。层次短语翻译系统有效地将同步上下文无关文法的重排......
本文提出了一种基于组合线索和核心扩展方阵匹配的中日句对齐算法。该方法利用字典、字形、长度和特殊字符相结合的组合线索来计算......
本文提出了一种面向机器翻译的中文分词自适应方法。该方法综合利用中文单语语料库和中英双语平行语料库,自动获取目标领域的分词......
本文设计了一种基于统计方法的短语翻译模型过滤器,不但可以计算翻译模型中短语翻译对的10多种统计值,并且按值对结果进行排序。最......
本系统采用基于MBR解码和混淆网络解码的多系统融合策略,融合结果来自于三个翻译系统:(1)基于短语的系统:抽取相容短语对,进行Beam-s......
本文对电脑理解人类语言问题进行了研究。文章围绕语言是人类对认知世界的知识进行编码的符号系统、电脑要进行“知识处理”必须理......
汉语机构名识别是现代汉语未登录词识别中最难实现的一项,至今未能找到十分令人满意的解决方法。本文提出了一种基于构成模式的汉......
实体关系抽取是信息抽取中的一个关键任务,其目的是找出文本中实体对之间的语义关系。本文阐述了一种改进的基于树核函数的实体关......
本文通过对咳嗽声特性的分析,首先利用短时过零率和短时能量对咳嗽声进行端点初步检测,然后提取咳嗽的Mel频率倒谱系数作为特征参......
对声纹识别(说话人识别)等与语音相关的技术进行研究时,需要大量的语音数据,以保证研究的可靠性与有 效性。可以说语音数据库是语......