垃圾评论过滤技术的研究及在Scratch作品评论管理系统中的应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:mhj911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,社交平台的出现在便利了用户沟通与交流的同时也造成了广告、脏话等不良信息的产生与传播。传统的机器学习方法或神经网络对于检测具有显著敏感词汇的垃圾评论文本具有一定的成效,但是由于中文汉字的复杂性以及网络书写的随意性,用户会使用相对不规范不敏感的变体词汇来代替敏感词汇以逃避对垃圾评论的检测。由于变体词通常是某种隐喻,不再具有汉字表面的字词含义,会导致常规检测方法的失效,所以如何准确地识别变体词汇,做到对垃圾评论的有效检测与过滤就变得尤为重要。针对以上问题和挑战,本文在深入研究与分析中文文本表示方法、垃圾评论过滤方法与联合上下文信息文本分类方法的基础上,围绕中文短文本垃圾评论过滤的方法进行研究。首先针对垃圾评论中常见的变体字特征,提出了多文本特征联合嵌入的垃圾评论过滤模型,该模型从读音与字形的角度去捕捉敏感词的主体特征从而应对变体词多种多样的变体形式,在保证模型正确识别垃圾评论的同时减少对正常评论的误判。之后为了进一步提升垃圾评论的过滤效果,提出了联合用户历史评论与多文本特征的垃圾评论过滤模型,将评论文本上下文信息作为额外信息进行补充利用,增加了特征信息的多样性。为了验证两种算法的有效性,本文在Scratch作品评论数据集与商品评论数据集上进行了多组对比实验,实验的结果充分证明了本文所提模型的有效性。最后,基于上述模型和方法设计实现了 Scratch作品评论管理系统,配合评论管理机制,有效的遏制了垃圾评论的出现,为平台用户提供了 一个积极健康的学习氛围。
其他文献
随着我国物流业的快速发展,快递业务量呈爆炸式增长,人工配送成本越来越高,社会对配送效率的要求也越来越高,以人工配送为主的传统物流已经无法满足社会需求。近年来,无人驾驶技术的兴起为物流配送提供了一个可行的解决方案,路径规划是物流配送的主要问题之一,研究无人车路径规划技术辅助无人车辆进行智能路线规划,对提升物流配送效率具有重要的意义。论文分别对无人车物流配送的全局路径规划和局部路径规划进行了研究,主要
随着信息化水平的不断提升,新浪微博活跃用户持续稳定增长,同时产生了海量的微博数据。微博数据反映了用户的兴趣偏好,对用户发布的微博文本进行分析,可以帮助他们发现感兴趣的话题;同时平台也可以基于用户兴趣进行个性化推荐,实现盈利。综上所述,用户兴趣挖掘对提升用户使用体验和促进平台健康发展具有重要意义。微博文档通常具有较长的时间跨度,用户兴趣也会随着时间的推移而不断改变,微博文本简短且包含了较多的噪音数据
脑科学的发展和人工智能相辅相成,脑科学与人工智能的交叉融合或将引发新的科技革命和产业革命,因此这两个领域得到了越来越多国家的重视。脑部医学影像分析是脑科学、医学和信息学的交叉,旨在快速高效准确地分析大量脑部医学影像数据,辅助专业医生进行脑部疾病的诊断与治疗,节约医生分析的时间和精力。近年来,随着以深度学习为代表的人工智能的第三次热潮的到来,基于神经网络的医学影像分析取得了巨大的成功,人工智能在脑部
某民航机场保障公司的库房管理有三个特点:一是货物差异性较大,由于公司的业务较多,不同部门负责保障的设备各不相同,各部门库房存放的货物大多是这些设备的维修备件,而且当业务发生变化时,库房存放的货物也需要进行调整,这就导致传统的面向业务的系统设计无法体现货物之间的差异性;二是货物归类难统一,由于旧的备件管理系统没有对货物命名的统一性和规范性作出约束,导致同一种货物可以有多个名称,当新入库货物时,员工往
计算、存储和传输技术的发展成果已经逐渐渗透到社会产业和人们的生活,数据共享对充分发挥数据本身的价值具有极其重要的作用。然而传统数据共享模式下电子数据使用痕迹不易监管等现象频现,各数据提供方不愿共享其数据,易出现“数据孤岛”问题。针对传统的中心化数据共享和管理在安全性、受控性等方面存在的问题,本文研究实现了基于区块链的分布式数据安全共享技术及其应用,论文主要工作和研究成果如下:第一,提出了基于区块链
随着互联网和视频技术的迅速发展,诞生了诸如直播带货、在线教育等行业,改变了人们的生活和工作方式。与此同时,实时视频产生的巨大流量给互联网传输带来了巨大挑战,视频卡顿多、延迟高等问题影响着用户的观看体验。因此,视频流的传输算法及其优化成为研究热点。本文设计和实现了针对移动端视频直播传输算法的测评平台,利用真实移动网络数据模拟链路,分析不同算法在不同网络场景中的表现。实验结果表明,基于机器学习的算法相
当前,随着人们的生活水平的逐渐提高,家长和老师越来越注重学生学习能力的发展。如何可以比较准确地对学生的学习能力进行评测和训练是一个值得探讨的问题,脑电波(Electroencephalogram,EEG)是一种生理电,可以准确地反映人的大脑活动情况,所以,结合脑电波对学生的学习能力进行评测和训练,可以更准确地了解学生的学习能力情况。因此,结合脑电波形成学能评测过程中的学能模型、学能训练过程中的学能