文本分词相关论文
随着我国“一带一路”倡议的提出及经济全球化的深入发展,跨语言交流在国家外交与民间经济交流方面的作用日益凸显。文本数据是信......
传统作战意图分析主要基于人为判定,实时性差,极易产生误判,无法满足实际作战需求。针对该问题,提出了一种基于余弦相似度的作战意......
该文主要涉及了文本信息处理和语音信号处理.首先,该文对文本相似度的计算进行了研究.我们分析了目前文本相同相似判别的方法,并且......
互联网的发展让我们的生活世界成为了地球村,网络的便捷性使人们每时每刻都能够从网络上获取信息。随着Web2.0技术的应用,人们不再......
DOI:10.3969/j.issn.1008-0821.2021.09.008 [中图分类号]G253.1 [文献标识码]A [文章编号]1008-0821(2021)09-0074-10 1引言 ......
随着通讯工具的发展,手机短信以其价格低廉、收发便捷、移动性好的特点受到了人们的欢迎。但在为人们带来极大便利的同时,随之而来......
粮食是人类的生存之本、生命之源,是人类生存下去的必备条件之一,而我国又是世界上的粮食大国,粮食的安全更是关系着国计民生、民......
在自然语言处理领域,双语平行语料库的重要性日益加强,其研究主要集中在构建、对齐和标注等方面,在机器翻译、词义消歧以及跨语言......
SimSimi是当前流行的智能聊天机器人,但是存在如回复需要用户训练、回复语句有限等问题。针对SimSimi存在的问题,提出一种利用微博作......
摘要:文本预处理是文本分析理解的基础,预处理结果可以直接影响到文本分析的准确率。中文文本语句结构复杂,词语之间没有明显的分隔标......
[摘 要] 将文本相似度计算引入“邻避”冲突事件的应急决策,通过对案例进行文本分词、词义相似度替换得到关键词频次,然后将数据矢量......
干旱灾害在历史上对我国生态环境、国民经济乃至政治格局造成了深远的影响。本研究采用了基于文本分词和语义统计方法的文本自动分......
计算机与网络己经被应用到了人们生活的方方面面,网络安全越来越受到人们的重视。2014年2月,中国中央网络安全和信息化领导小组成......
在线短租平台的快速发展为人们带来了新的体验,同时也产生了大量的评论数据,这些评论以住户的直接感受描述着房屋的好坏,人们在出......
随着互联网及移动手持设备的普及,微博因其低门槛性以及自由随性的特点,在短时间内发展迅速,变成了人们交流和获取信息的一个重要......
为全面贯通检修-调度一体化安全流程,实现检修申请单直接智能生成调度操作票,从检修申请单文本分词的思路出发,通过研究基于规则的......
为解决实际教学过程中教学内容较多的问题,提出面向教学的知识点定义,在基于切分单元的最大匹配算法基础上,结合优化规则进行知识......
定向文本预测,往往存在预测不准、数据量大、针对性不高等问题。提出基于分词的关联规则预测方法,以煤化工行业为例进行发展方向的预......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
近年来Python广泛应用于包括自然语言处理在内的数据处理和人工智能等领域。以实例探讨Python环境下基于jieba库的文本分词、基于W......
在信息系统运维服务过程中,大量客户的咨询问题都是重复的,这为运维人员带来了很多重复性工作。基于文本分词的智能人机对话系统可......
随着微博的迅猛发展,微博相关方向的数据挖掘已经成为研究热点。而如何高效、完整地采集微博信息并对其进行预处理,将大大影响微博......
藏文分词是实现藏文语音合成和藏文语音识别的关键技术之一。提出一种基于双向长短时记忆网络加条件随机场(bidirectional long-sh......
大数据和人工智能是当前计算机领域的两大热门方向,其应用正在改变我们的生活、工作和学习,其中一个应用就是自然语言处理。分析处......
由于大数据时代的来临,网络招聘形式占所有招聘形式的比重越来越大。本文通过对网络招聘信息数据进行中文分词和文本向量化处理后,......
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了......
文本分词是各个互联网领域中的基础性工作。通过对平台涉及的文本串进行切词处理,对切词之后的短文本串更能够聚合用户。隐马尔可......
随着互联网的发展,人们对于网站检索的需求日益增大。将网站进行分类可以极大地提升检索效率,研究中文网站的自动分类技术具有较高......
针对电信业对投诉热点话题缺乏有效的检测方法问题,提出一种基于峰值密度聚类算法的投诉热点话题检测方法。首先建立电信业专用词......
针对互联网,尤其是微博平台中大学生用户产生的海量的文本分类问题,应用贝叶斯网络分类器对微博评论进行分类。基于贝叶斯通过先验......
Python作为一种解释性高级编程语言,已经深入大数据、人工智能等热门领域。Python在数据科学领域具有广泛的应用,比如Python爬虫、......
针对互联网,尤其是微博平台中大学生用户的海量文本,应用贝叶斯网络分类器对微博评论进行分类。基于贝叶斯,通过先验概率和似然度......