数理语言学相关硕士博士期刊学术论文

数理语言学相关论文

基于三特征流DBN 模型的听视觉情感识别

本文构建了一种三特征流混合动态贝叶斯网络（T_AsyDBN）听视觉情感识别模型，听觉流采用MFCC特征和经过PCA降维的局部韵律特征，视觉流定......

会议

情感语音语音识别 MSHMM模型数理语言学

基于内容的音频拷贝检测系统

互联网上音频数据量的激增，使音频内容拷贝检测渐成为热点。本文选取频带能量差异做特征设计了一个基于指纹索引的快速音频拷贝检......

会议

语音识别音频指纹匹配算法数理语言学

基于词汇等级的汉语作文自动评分技术

作文是汉语考试的必考项目，寻找简单有效的作文自动评分算法无疑可以很大地提高作文阅卷的效率。本文在词汇等级方面研究作文自动评......

会议

汉字处理作文评分词汇分析数理语言学

拓扑相关的加权有限状态转换器ε-Removal 算法

基于加权有限状态转换器的语音解码技术是当前语音识别领域的研究热点之一。利用加权有限状态转换器的相关理论和算法，可以构建语......

会议

语音识别解码技术拓扑算法数理语言学

基于Viterbi 解码的中文韵律短语边界自动标注

本文提出了一种基于声学模型Viterbi解码的中文合成音库韵律短语边界自动标注方法，以降低大语料库单元拼接合成系统的构建成本。该......

会议

语音合成韵律标注 Markov模型数理语言学

Hmm语音合成中结合频域Delta LSP整体方差的参数生成算法

研究表明，基于隐马尔可夫模型的语音合成(HMM-based speech synthesis)中结合整体方差(Global variance, GV)模型的参数生成方法对......

会议

语音合成音节频谱 GV模型数理语言学

跨方言声调生成系统及变调处理系统的设计

为获得具有通用性的声调处理系统，本文运用计算语言学方法，基于管辖音系学理论提出跨语言声调处理算法。经分析天津话和丹阳话变调算......

会议

语音信号跨方言声调变调处理数理语言学

基于逆滤波的谐波噪声激励模型

传统基于线性预测(LP)声码器采用简单的脉冲加白噪声激励模型，合成语音有严重的机器声。为了提高传统线性预测声码器的合成音质，本......

会议

语音合成语音编码谐波噪声数理语言学

基于压缩感知过程的语音增强新算法

压缩感知（compressive sensing，CS）是一种基于信号稀疏性的采样方法，可以有效提取信号中所包含的信息。本文提出了一种基于CS过程的语......

会议

语音增强信号处理正交匹配跟踪数理语言学

基于音素相关后验概率变换的发音质量评价

帧规整对数后验概率是目前公认最有效的发音质量的度量。本文证明了该度量反映了当前发音对应的声学模型与概率空间中声学模型的......

会议

汉语发音音素度量后验概率数理语言学

基于AAM和异步发音特征DBN 模型的逼真可视语音合成

本文提出了一种基于主动外观模型(AAM)特征和异步发音特征DBN模型(AF_AVDBN)的逼真可视语音合成方法。在 AF_AVDBN模型中，发音特征（......

会议

嘴部动画语音合成 DBN模型数理语言学

基于向量空间模型的网页文本句子对齐方法研究

平行网页文本中除了互为对照的内容，还存在一些无关的噪声，因此利用网页结构相似的方法解决平行网页中句对齐问题受到一定的限制。通......

会议

语音处理互译词典 CHI统计数理语言学

基于不同音素概率分布的发音质量分数映射方法

现有的计算机辅助语言学习系统（Computer Assisted Language Learning，CALL）在得到GOP分数之后，对所有的音素都使用相同的映射函数计算......

会议

语音信号信号处理 PDMA算法数理语言学

基于层叠条件随机场的句法语义自动标注研究

本文提出了一种基于层叠条件随机场的CFN句法语义自动标往方法。该方法在低层条件随机场模型中解决了框架元素的识别,将识别结果传......

会议

汉字处理语义标注条件随机场数理语言学

基于基本块的汉语功能块自动标注

本文研究了基于基本块信息使用条件随机场模型(CRF)对汉语功能块进行自动标注的问题，针对词和基本块的两种不同的标注策略,将汉语基......

会议

汉字处理词义标注条件随机场数理语言学

统计和规则相结合的汉语最长名词短语自动识别

本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法。首先使用条件随机场模型进行标注识别,再结合最长名词短语的边......

会议

汉字处理短语识别条件随机场数理语言学

应用HPSG理论实现汉语NP的自动分析

在汉语NP自动分析中,名词和量词的搭配问题是难点。本文在HPSG理论框架下,构建了汉语NP的形式化模型，并分析了该模型在LKB系统中的......

会议

汉字处理词汇搭配语言分析数理语言学

基于最大熵模型的中文阅读理解技术研究

本文基于山两大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构造了词层面以及句法层面共计35个......

会议

汉字处理阅读理解最大熵模型数理语言学

基于CRF的汉语动词“像”的比喻义识别

汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的比喻标志(比喻词),成为一种较理想的用于计算机自动处理的比喻类型。本文着......

会议

汉字处理喻义识别隐喻计算数理语言学

有标记联合结构的语言学特征统计分析

本文统计和分析了有标记联合结构内部和外部的语言学特征,内部特征方面主要考察了联合结构的词性序列分布、短语序列分布。外部特......

会议

文字处理词性分布语言学特征数理语言学

基于依存关系的语义角色标注

本文利用依存关系进行语义角色的标注,在CONLL2008提供的shared task语料库上进行训练和测试，经过相关剪枝算法处理以后,使用最大熵......

会议

文字处理语义标注最大熵分类数理语言学

语义角色在指代消解中的研究

本文实现了一个基于机器学习的指代消解平台。在此基础上,通过自动语义角色标注工具得到目标动词和语义角色信息,组合语义角色特征......

会议

汉字处理语义标注指代消解数理语言学

网页去重系统的设计与实现

本文针对互连网上近似镜像网页严重降低搜索引擎效率的现象,提出了一种去重的方法。该方法通过句子在文中的位置和组块的重要度,提......

会议

文字处理镜像网页网页去重系统数理语言学

统计与规则结合的古文对联应对模型

本文将古文对联规则区分为硬规则与软规则,用软规则指导建立对联应对的有向概率图模型,使用EM算法估计模型参数,在解的搜索过程中......

会议

汉字处理古文对联应对模型最大熵模型数理语言学

一种利用关键词提取的面向查询多文档文摘技术

本文针对面向查询的多文档自动文摘,提出了一种利用关键词提取技术的文摘句选择策略。通过计算多文档集中词语的查询相关性特征和......

会议

文字处理关键词提取语句选择数理语言学多文档自动文摘

基于内容特征的垃圾博客过滤

本文根据垃圾博客和正常博客在内容特征上的差异,对多种针对博客分类有效的统计特征进行了分析,提出了基于博客内容统计特征的过滤......

会议

文字处理垃圾博客过滤语言分析数理语言学内容特征

基于K-最近距离方法的哈萨克语报纸分类初探

本文利用K-最近距离的方法对哈萨克语报纸进行分类,初步实现了利用统计词频信息和语言信息相结合的方法选择特征词,且计算特征的权......

会议

文字处理哈萨克语文本分类数理语言学

文本倾向性分析用于金融市场波动率与金融信息相互关系的研究

互联刚金融信息对于金融市场的影响在当代已经越来越不可忽视.面对海量的信息,其中大部分为非结构化的文本数据。本文结合目前已有......

会议

文字处理金融信息相互关系文本分析数理语言学

基于用户日志分析的查询扩展研究

查询扩展是信息检索中关键问题之一,查询扩展的有效性决定其检索性能。用户查询日志是大量用户长期查询行为的记录,通过挖掘用户查......

会议

文字处理信息检索语言分析数理语言学用户日志分析

基于最大匹配和马尔科夫模型的对联系统

对联,雅称“楹联”,俗称对子,它言简意深,对仗工整,平仄协调,是一字一音的汉语语言独特的艺术形式，可以说对联艺术是中华民族的文化......

会议

汉字处理对联生成语言匹配数理语言学最大匹配马尔科夫模型

基于汉语框架知识库的旅游信息问答系统设计

本文在汉语框架语义知识库的基础上,利用语义WEB语言,通过汉语框架语义知识库对问题进行语义分析,并利用旅游本体知识库对答案进行......

会议

汉字处理语义分析语义知识库数理语言学

从实际应用看GoogleTM语言模型的缺陷

在Google应用中使用的语言模型与其公开的Web 1T 5-gram库有很大不同，一个根本的差异体现在是否忽略标点符号。本文以谷歌拼音输入......

会议

文字处理文档分析语言模型数理语言学

语义角色标注的方法与挑战

全自动的语义分析一直是自然语言理解的主要目标之一。通过深层语义分析,可以将自然语言转化为形式语言,从而使计算机能够与人类无......

会议

汉字处理自然语言语义分析数理语言学

基于三类训练两类判别框架的主客观性句子识别

本文以实词作为特征,采用Na(i)ve Bayes和最大熵分类模型进行主客观句子的判别。在公开的评测语料MPQA上实验结果显示：Na(i)ve Brdy......

会议

汉字处理句子判别语言分析数理语言学

基于条件随机场的冠词选择研究

冠词选择需要综合考虑语言知识、语义知识以及世界知识,是汉英翻译中的一个难点。本文针对传统的基于规则和机器学习的方法只考虑......

会议

汉字处理冠词选择条件随机场数理语言学

基于语义结构平行的汉语人称代词消解

如何让计算机根据自然语言的语义表示消解句子乃至段落篇章中的人称代词,一直是自然语言处理的一大难题。本文依据HNC理论的句类表......

会议

汉字处理人称代词指代消解数理语言学

面向特定领域的多字词表达式的提取

本文在阐述多字词表达式的定义的基础上,对面向特定领域的多字词表达式提取的技术路线进行了详细说明,并在方法、面向对象规模、效......

会议

汉字处理词汇提取多字词表达数理语言学

语篇标注语料库的建设研究

本文主要介绍一个语篇标注体系,该标注体系采用自底向上的方法对基本语篇形式单元(BFDU)到句群等语篇中不同层次的语言单位和其间......

会议

汉字处理语篇标注语料库建设数理语言学

一种基于N-Best结果组合优选的词语对齐方法

本文提出了一种从句对齐语料中抽取出词语对齐的新颖方法。文章比较了主流的词语对齐方法,分析了IBM模型,发现模型在挑选最佳对齐......

会议

汉字处理词语对齐词汇优选数理语言学

基于层次短语的统计翻译系统中规则冗余的高效约束方法

基于层次短语的统计机器翻译模型是近年来比较流行且翻译质量较好的一种模型。层次短语翻译系统有效地将同步上下文无关文法的重排......

会议

文字处理层次短语机器翻译数理语言学

基于组合线索和核心扩展方阵匹配的中日句对齐

本文提出了一种基于组合线索和核心扩展方阵匹配的中日句对齐算法。该方法利用字典、字形、长度和特殊字符相结合的组合线索来计算......

会议

文字处理机器翻译语句匹配数理语言学

一种面向统计机器翻译的中文分词自适应方法

本文提出了一种面向机器翻译的中文分词自适应方法。该方法综合利用中文单语语料库和中英双语平行语料库,自动获取目标领域的分词......

会议

语言处理机器翻译自动分词数理语言学

基于统计方法的短语翻译模型过滤器设计

本文设计了一种基于统计方法的短语翻译模型过滤器,不但可以计算翻译模型中短语翻译对的10多种统计值,并且按值对结果进行排序。最......

会议

语言处理机器翻译翻译过滤器数理语言学

中科院自动化所评测技术报告(SYSTEM Ⅱ)

本系统采用基于MBR解码和混淆网络解码的多系统融合策略,融合结果来自于三个翻译系统：(1)基于短语的系统：抽取相容短语对,进行Beam-s......

会议

语言处理机器翻译语言代码数理语言学

电脑理解人类语言需要理论创新--学习“概念层次网络”理论的体会

本文对电脑理解人类语言问题进行了研究。文章围绕语言是人类对认知世界的知识进行编码的符号系统、电脑要进行“知识处理”必须理......

会议

语言处理语言编码机器识别数理语言学

基于构成模式的汉语机构名识别

汉语机构名识别是现代汉语未登录词识别中最难实现的一项,至今未能找到十分令人满意的解决方法。本文提出了一种基于构成模式的汉......

会议

汉语处理中文机构名机构名识别数理语言学

基于树核函数的实体关系抽取方法研究

实体关系抽取是信息抽取中的一个关键任务,其目的是找出文本中实体对之间的语义关系。本文阐述了一种改进的基于树核函数的实体关......

会议

文字处理语义分析树核函数数理语言学

基于隐马尔可夫模型的咳嗽声识别研究

本文通过对咳嗽声特性的分析,首先利用短时过零率和短时能量对咳嗽声进行端点初步检测,然后提取咳嗽的Mel频率倒谱系数作为特征参......

会议

语音识别咳嗽模型实验语音学数理语言学

声纹识别语音数据库建设的探讨

　　对声纹识别（说话人识别）等与语音相关的技术进行研究时，需要大量的语音数据，以保证研究的可靠性与有效性。可以说语音数据库是语......

会议

语音识别声纹分析语音数据库数理语言学

灵感思维探析

我相信在党和灵感。——爱因斯坦“灵感（InsPiration）”源于古希腊神话，它的本意是指通神或吸入了神赐的灵气．灵感，这种人类思维的突发......

期刊

灵感思维科学创造心理学显意识创造性成果中国科学院院士王极盛思维科学大陆漂移狭义相对论数理语言学

看过本文同时还关注