未登录词相关硕士博士期刊学术论文

未登录词相关论文

数学自然语言处理中新定义的理解及其应用研究

自然语言处理（Natural Language Process,NLP）是一种让计算机尝试学会理解和处理人类口语或书面语的计算机技术。它与基于语言理解的......

学位

中文自然语言处理初等数学新定义问题未登录词

融合双语词典的汉缅神经机器翻译方法研究

神经机器翻译成为当前机器翻译的主流方向,在语料资源丰富的语言对上达到了极高的性能,但是在汉-缅这种低资源语言对上应用还不太......

学位

汉-缅双语平行句对抽取双语词典未登录词神经机器翻译

基于神经网络的文本摘要生成技术研究

日常生活中,人们的阅读量越来越多,但获取的有效信息却越来越少,这本质上源于信息过载。文本摘要技术可以帮助读者快速了解文章主......

学位

文本摘要端到端模型 C-RNN编码器未登录词注意力机制

基于字符信息相关性与多语义特征的命名实体识别研究

命名实体识别任务的目的在于高效地从文本信息中抽取实体信息,是自然语言处理的基础性工作,但受制于数据中未登录词的影响,导致命......

学位

命名实体识别未登录词双数组Trie树 GCN

基于知识库问答的未登录词研究

近年来,随着人工智能的高速发展,传统的搜索引擎已经越来越难以满足人们的搜索要求。相比搜索引擎依靠的关键字匹配,智能问答系统......

学位

智能问答系统未登录词词向量流形排序动态规划循环神经网络

现代汉语深度语义标注语料库研究

当前,世界各国学者都十分重视自然语言处理的知识资源的建设,建立了许多带各种标注信息的语料库,以适应更为深入的语言研究和自然......

学位

语义语法学语义词类句法语义范畴未登录词知识库语义角色

基于混合策略的汉语未登录词整体识别

未登录词的识别一直是汉语分词研究的焦点和难点,本文通过对各类未登录词的用字频率及上下文进行了详细地分析,提出一种基于混合策......

会议

未登录词汉语分词混合策略全局统计中文信息处理

基于混合策略的中文生物医学领域未登录词识别研究

简述了中文未登录词识别研究现状,结合中文生物医学领域词长分布和构词特点,提出以n-gram为基础,综合利用领域词典、语料和规则的......

会议

生物医学未登录词识别算法混合策略

汉字构字的面向对象思维与信息过滤

在汉字的起源和发展过程中,一种类似计算机面向对象程序开发的面向对象思维对汉字构字产生了重要的影响。文章首先对汉字起源和现......

会议

汉字构字面向对象未登录词拆解字失效算法

双粒度轻量级漏洞代码切片方法评估模型

针对现有漏洞代码切片方法评估过程存在的切片信息抽取不完全、模型复杂度高且泛化能力差、评估过程开环无反馈的问题,提出了一种......

期刊

代码切片漏洞检测未登录词轻量级评估方法

基于深度学习的生成式文本摘要技术综述

在互联网数据急剧扩张和深度学习技术高速发展的背景下,自动文本摘要任务作为自然语言处理领域的主要研究方向之一,其相关技术及应......

期刊

深度学习生成式文本摘要未登录词生成重复长程依赖评价标准

基于知识增强的中文命名实体识别

基于字词联合的中文命名实体识别模型能够兼顾字符级别与词语级别的信息,但受未登录词影响较大且在小规模数据集上存在训练不充分......

期刊

中文命名实体识别注意力机制知识增强未登录词小规模数据集

基于逆向最大匹配分词算法的汉盲翻译系统

汉盲翻译是把汉字源文本自动翻译为对应的盲文文本,目前存在着多音字混淆、未登录词不能增加、不符合盲文分词连写规则等挑战。构......

期刊

汉盲翻译中文分词未登录词逆向最大匹配

OPINAX一个有效的产品属性挖掘系统

产品属性抽取是产品意见挖掘的重要任务之一,直接影响着产品意见挖掘的性能.本文提出了一种基于语言依存分析和语料库统计相结合的......

会议

未登录词产品属性挖掘系统语料库统计特征抽取算法排序方法

汉语文－语转换中的语言学处理

本文介绍了一个计算机实现的汉语文－语转换系统，它以词为单位，将文本按句子输出，可保持自然语言的韵律。为了改善合成语音的自然度和可......

期刊

合成语音转换系统汉语语音自然度文本结构自动分词未登录词分词系统可理解性韵律感

语言学科“九五”重大课题启动——简介《信息处理用现代汉语词汇研究》

语言学科“九五”重大课题启动———简介《信息处理用现代汉语词汇研究》本刊记者由国家语委承担的国家社科基金语言学科“九五”......

期刊

现代汉语词汇语言学科国家语委专家论证会汉语词义语言文字中文信息处理未登录词分词系统自动分词

中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96

1.会议概况由新加坡举办的中文电脑国际会议(International Conference on Chinese Computing,简称ICCC)起源于1986年8月。国立......

期刊

中文信息处理 ICCC 语言信息处理自动分词学术刊物邀请报告句法分析入选论文未登录词语义网

汉语分词系统中的信息集成和最佳路径搜索方法

复杂的汉语分词系统中，各种信息的有效集成是系统实现的关键。本文介绍了分调系统SegTag中信息集成方法，并讨论了信息集成结构中的两......

期刊

路径搜索汉语分词词性标注分词系统未登录词分词算法评价函数有向图数据结构动态规划

基于CRFs的领域爆发词识别的研究与实现

通过对爆发词识别问题的研究和剖析,本文采用了基于条件随机场模型的方法进行爆发特征提取,在此基础上设计了频次、频率和词频文档......

期刊

爆发词随机场模型爆发特征识别实验特征提取条件随机场系统原型词频原型系统未登录词

第41届国际计算语言联合会在日本召开

20 0 3年 7月 7日至 12日 ,第 4 1届国际计算语言联合会 (4 1stAnnualMeetingoftheAssociationforComputation alLinguistics,4 1t......

期刊

计算语言自然语言处理问答系统信息检索有限状态语言汉语分词最大熵模型软件产品未登录词北海道大学

中文基本地名识别

本文探讨了地名的概念、构成等问题,并针对其分布特点,使用常见地名匹配、碎片分析和组合扩展相结合的方法初步识别了中文基本地名......

期刊

文字处理中文地名地名识别数理语言学

基于语料库的现代汉语词缀与派生词自动识别问题初探

汉语词缀的显著特点是语义半虚半实、位置固定以及较高的能产性。词缀能够批量造就语言中急需的部分词语,造词规则较为明晰简单,符......

期刊

现代汉语词自动识别未登录词造词能产性现代汉语语法自动切分句法分析经济性原则自动分词

纪念上海现代语言学(XY)沙龙活动三十周年

今年是上海XY语言学沙龙开始活动三十周年,听说上海要举办一个纪念性会议,感触很深。时间飞逝,不觉三十年过去了。这些年来其实我......

期刊

上海现代沙龙活动 XY 中文信息处理组织能力上海大学未登录词前几语言信息处理计算语言

维基百科中本体分类关系获取方法研究

近年来,随着语义网、搜索引擎,信息检索的兴起,本体学习越来越多的被人们所提及,本文以维基百科为语料库,充分利用维基百科的机构......

期刊

维基百科分类关系义句基于模式上下位关系词性标注句法分析依存结构中文信息处理未登录词

中文分词算法研究

中文分词技术是中文信息处理中的重要环节，中文分词算法与中文分词系统的性能紧密相关。目前的分词算法可以分为基于字符串匹配的分......

学位

中文信息处理分词算法中文分词系统歧义排除未登录词蚁群算法

基于神经网络的语音翻译关键技术研究

随着经济全球化与互联网技术的飞速发展，跨语言的沟通以及信息传递成为学术前沿研究、企业持续发展的必要基础。因此，如何协助单语种......

学位

机器翻译未登录词自注意力神经网络不流畅检测标点恢复

交互式口语翻译方法及相关问题研究

随着科技的进步、社会的发展、全球化进程的加快和国际交流的日益频繁，消除不同语言的障碍也显得愈加重要。机器翻译作为解决这一问......

学位

口语翻译交互式翻译未登录词未登录短语数据选择方法机器翻译

汉语分词中未登录词识别及词性标注的研究与实现

本文主要介绍了汉语分词中未登录词识别与词性标注方法。未登录词是影响汉语分词准确率的一个重要因素，未登录词包括人名、地名、时......

学位

汉语分词未登录词词性标注自动分词

汉语文本自动分词和词性标注系统的研究与实现

该文研究了自动分词和词性标注系统可以为短语识别、句法分析提供较好的基础,尤其为短语识别提供了较丰富的分词标注信息以及词频......

学位

机器翻译未登录词分词岐义词性标注语料库

一种基于组合模型的中文未登录词词性猜测方法

在当今信息时代,伴随社会、经济、文化等的飞速发展,生活中不断涌现了大量的中文未登录词语。这些未登录词语在丰富了语言色彩的同......

学位

中文未登录词语词性上下文内部特征外部特征

大规模WWW文档分类与特征词抽取方法研究

当前,随着Internet技术的推广和应用,国际互联网已经成为世界上最大的信息资源库和全球范围内传播信息的最主要的渠道.如何帮助用......

学位

文档分类 VSM向量空间模型多层次分类特征项未登录词 N-grams 互信息

中文短文本未登录词发现及情感分析方法研究

随着互联网科技的蓬勃发展,微博微信等即时通讯工具随之出现,由于其具有简单易用,传播迅速等特点,日益成为大众日常重要的沟通交流......

学位

情感分析未登录词发现特征扩展深度信念网络

基于Hash算法的中文自动分词技术研究

中文自动分词技术是网络搜索引擎的关键技术之一，是中文信息处理中的重要环节，也是智能计算、文献标引、自然语言理解和处理的基础。......

学位

中文自动分词 Hash算法分词词典歧义字段未登录词搜索引擎中文信息处理

基于用户查询的中文未登录词识别技术的研究

随着Internet的快速发展，Web信息的迅速增加，人们越来越依赖使用搜索引擎来获取互联网上有用的信息。中文未登录词的识别和歧义的消......

学位

汉语分词未登录词姓名识别查询日志用户查询逻辑运算符未登录词识别

规则与统计相结合的英语词性标注系统的研究与实现

词性标注是机器翻译过程中的关键环节，其主要作用是确定句子中各单词的词性并加以标注。词性标注研究的重点是如何确定句子中兼类词......

学位

词性标注未登录词机器翻译隐马尔科夫模型英语翻译

基于Web的双语词汇构建关键技术研究

双语词汇的构建是自然语言处理领域一项很基础的工作。双语词汇的好坏直接影响到机器翻译、跨语言检索等自然语言处理系统的性能。......

学位

音译词识别直译词识别基本短语标注译文挖掘翻译对抽取

基于统计的中文文本关键短语自动抽取方法研究

关键词抽取是文本信息处理的重要技术,是在进行文本自动摘要、文本自动分类、主题提取及专利检索分析等文本信息理解工作时,都要应......

学位

关键短语抽取完整短语未登录词左右邻信息决策树小世界网络网络特征值文本特征

综合字典和统计分析的中文分词系统的研究与实现

中文分词技术主要包含以下三个研究方向：理解分词,机械分词以及统计分词。基于理解的分词方法研究尚未成熟,所以,绝大部分中文分词......

学位

词典统计未登录词歧义词

基于语素的汉语词法分析方法研究

作为中文信息处理的关键问题之一,汉语词法分析主要包括分词、词性标注和词义消歧三个子任务。虽然近年来汉语词法分析取得很大进......

学位

汉语词法分析中文分词词性标注词义标注未登录词

基于Web的未登录词翻译技术研究

未登录词(Out of Vocabulary,简写为OOV)的查询翻译是影响跨语言信息检索(Cross-Language Information Retrieval,简写为CLIR)性能......

学位

跨语言信息检索查询翻译未登录词搜索引擎维基百科

一种中文未登录词识别及词典设计新方法

中文分词是中文信息处理领域的一项基础性课题,未登录词识别问题又是中文分词的瓶颈问题之一。为了解决中文分词中的未登录词识别......

学位

未登录词中文分词词频统计核心词典

基于词典和词频分析的论坛语料未登录词识别研究

中文自动分词技术是中文信息处理的一个基础性课题,在中文信息处理中,首先需要对词进行切分,然后才能进行更深层次应用研究,随着信......

学位

未登录词中文分词词频分析核心词典

涉及未登录词的网络舆情多模态数据处理方法研究

网络社区中产生的舆情信息包括大量文本、图片和视频等多种模态数据,其传播方式具有随意性、快速性、便捷性等特点,是社会舆论的聚......

学位

未登录词网络舆情图片文字识别文本处理多模态数据

Intranet搜索索引自动生成工具Weblndex

本文在分析几种典型Ｉｎｔｅｒｎｅｔ搜索引擎的基础上，设计实现了一种面向Ｉｎｔｒａｎｅｔ的信息收集ａｇｅｎｔ，着重阐述了ＷｅｂＩｎｄｅｘ，一个基于ＩＩＣＡ体系的Ｉｎｔｒａｎｅｔ搜索索引自动生成工具。该系统克服了......

期刊

Intranet Weblndex 索引项生成工具可移植性信息检索自然语言处理未登录词汉语自动分词向量空间

从计算机自动分词的障碍谈汉语书面语改革

本文从政府进行语言规划和中文信息处理的角度,建议汉语书面语应该进一步改革,实行分词连写,使中文信息处理能够绕过计算机技术上......

期刊

自动分词中文信息处理汉语书面语语言规划最大概率法未登录词字串分词单位机构名句法分析

自动分词与分词规范——关于《信息处理现代汉语分词规范》的重新思考

动分词技术是计算语言学中的一个瓶颈问题,在刚刚做过的留学生汉语语料库词性标注工作中,我们也发现了许多关于自动分词的问题。围......

期刊

自动分词汉语分词计算语言学未登录词词性标注最大概率法分词技术消歧歧义问题分词单位

基于CRFs的中文领域术语自动抽取研究

本文提出基于条件随机场（CRFs）的中文领域术语的自动抽取方法，在给定领域分类语料前提下，该方法不仅很好解决了未登录词中的领域术语抽......

会议

CRFs 条件随机场机器学习互信息领域术语特征选择

面向专利文献的中文分词技术的研究

针对专利文献的特点，本文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记，结合切分文本的上下文......

会议

专利文献中文上下文信息未登录词切分概率分词文本识别问题分词方法前后缀后处理多策略语料统计术语实验规律测试标记

维吾尔语数词词干提取研究

本文中比较详细地描述了维吾尔语数词词干提取所存在的问题，并对其进行了分析。提出了基于有限状态自动机和词典查询相结合的维吾尔......

会议

维吾尔语数词词干提取提取算法有限状态自动机未登录词词典查询准确率

基于规则的维吾尔语词性自动标注系统的研究

本文叙述了现代维吾尔语词类体系和构词自动机，确定了现代维吾尔语词性标注标记集。最终提出了一种基于规则的维吾尔语词性自动标注......

会议

维吾尔语词性自动标注词性标注词表未登录词词类体系标注规则自动机标记集系统设计构词

看过本文同时还关注