【摘 要】
:
随着网络的日益发展和普及,信息量爆炸性地增长,每一秒都会产生大量的新的数据并传播于网络。BBS应运而生并逐步发展渐成为人们发表言论、表达思想的重要平台。如何通过对BBS
论文部分内容阅读
随着网络的日益发展和普及,信息量爆炸性地增长,每一秒都会产生大量的新的数据并传播于网络。BBS应运而生并逐步发展渐成为人们发表言论、表达思想的重要平台。如何通过对BBS中海量的文本内容进行挖掘,来对BBS用户进行评价从而有效地指导BBS的管理活动、促进BBS发展,已日渐成为一个重要的命题。本文中选取了近年来兴起诗词论坛作为研究对象,引入自然语言处理的方法,通过对历史数据挖掘建立用户的评价模型。本文的主要工作有:(一)在网页的信息采集和信息抽取之后提出了三重词语匹配方法通过计算文本相关度来去除噪声。(二)诗词专业领域极性词典的构建。本文引进了HowNet,对其词条进行了汰选,得到极性词典一,作为情感极性分析依据。在对100多部诗话进行分词的基础上,采用人工选取和相似度计算扩展得到了极性词典二,作为专业评价的极性依据。(三)话题热度与文本极性分析。在文本极性分析方面,对白话、文言文本进行分开处理。基于现代语义,在句法分析的基础上综合考量了副词对极性表达的影响来对文本进行极性分析。首次提出了一种基于文言语义的文本极性分析的方法。(四)在话题热度分析和情感分析的基础上,本文最终选取了主题平均热度,主题平均支持率,参与讨论的话题数,主题总量,回复总量作为影响因子,采用了决策树方法建立了BBS用户评价分类模型并提取了规则。
其他文献
虹膜识别是近些年以来兴起的生物特征识别技术,已经被广泛应用在社会生活的多个领域,这种技术具有很强的生命力。本论文中,在对已经存在的虹膜定位、虹膜特征提取和特征匹配
随着计算机技术的快速发展,计算机的运算能力和计算速度都有了飞速的提高,计算模式也从基于主机的集中式到基于网络连接的分布式。计算机的应用也从最初的数值计算转向了数据
随着计算机网络的高速普及,IPv6网络已经逐渐进入了我们的视线,针对IPv6网络的攻击方法也日益增多,在众多的攻击方式中最为突出的就是针对IPv6网络传输数据的拦截、监听、篡
试验靶场对飞行中的导弹进行跟踪测量,获取数据,进行处理和分析。为了准确的测量数据,在导弹试验的发射场区和航区配置有很多的测量控制设施,并且测控站和参试的仪器大都在一些山头和视野比较开阔的海边高地。靶场环境是各种仪器,设备集中的环境,各种干扰和噪声也大量存在。对这些测量设备进行频率稳定性测量,确保参试仪器的可靠性是非常重要的工作。针对野外靶场环境对频率测量的机动、快速、自动化特殊要求,本文研究用连续
随着社会生产和经济的发展,多目标优化问题越来越受到广泛关注。现实世界中的许多优化问题都涉及到多个目标的同时优化,而且多个目标之间往往是相互矛盾的。与单目标优化问题不
无线传感器网络结合了计算技术、网络技术和无线通信技术,是一种新型信息获取和处理的技术,已经广泛应用到经济和军事各个领域。无线传感器网络主要特性有能量有限、计算存储
针对当前自然计算模型中普遍存在的全局与局域搜索过程之间的平衡问题,本文通过借鉴自然界下雨及雨滴受重力影响沿地形垂直径向局部流动的动态过程;探讨了一种雨滴计算模型的
随着无线传感器网络在各个领域的快速发展和广泛应用,当前大多数网络协议已不能满足很多领域对节点低能耗及低延时的要求。因此如何提高传感器节点能效,成为当前迫切需要解决的
互联网和电子商务的发展,产生了大量的数据,从而导致网络资源的信息过载。当搜索引擎技术已经无法解决信息过载问题时,推荐系统应运而生。常见的推荐系统有:协同过滤推荐、基
人脸识别技术是计算机视觉和模式识别等领域非常活跃的一个研究方向。传统的人脸识别算法多假设人脸数据集具有全局的线性结构;而随着数据分析技术的发展,人们发现高维数的人脸