结合AdaBERT的TextCNN垃圾弹幕识别和过滤算法

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:iammycsj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决使用BERT(Bidirectional Encoder Representations from Transformers)模型时,参数规模太大的问题,本文采用了结合AdaBERT(Task-Adaptive BERT)的TextCNN算法.首先使用AdaBERT对弹幕文本进行学习,以更少的时间获得更有效的词向量;使用其生成的词向量作为TextCNN的输入;然后使用批量标准化,减少梯度消失的情况发生;最后使用Soft?max进行分类概率计算.为了验证本算法的有效性,在弹幕数据集上进行训练,和多个文本分类算法进行对比实验.其结果表明,本算法可以改进算法运行速度,提高在垃圾弹幕识别和过滤上的性能.
其他文献
多端直流系统故障电流上升速度快,仅靠直流断路器无法可靠隔离故障,需要配置故障限流器降低故障电流上升速度.目前,多端直流系统故障限流器配置方法大多未考虑故障后换流站闭
大量电力电子设备接入电网导致电网振荡频繁发生并使其逐步向宽频域振荡发展.首先,分析了广域测量系统监测技术在振荡监测存在的问题和局限,讨论了现有间谐波测量算法存在的
在气象业务服务中,通常需要实时关注天气的变化及降雨变温的情况,尤其在强天气过程中,单点强降雨对人们的生活会造成较大的影响。利用百度地图开发接口将气象观测数据进行实时展示,提高气象工作者对数据的分析效率。
在石油地质领域中,裂缝研究是油气勘探的重点。而且,岩心裂缝统计参数分析的准确程度,对油气勘探开发和提升采收率都有着一定程度的影响。由于岩心裂缝中存在大量的交叉裂缝,会对裂缝的统计和计算裂缝的分布特征造成影响。因此,本文在识别岩心裂缝的基础上,通过改进Freeman链码直线检测算法,对细化后的交叉裂缝骨架进行分离;通过分离的裂缝骨架对整个交叉裂缝进行分离。实验结果证实,该算法能较好地对交叉裂缝进行分
车联网作为提高交通效率和安全最有前途的技术之一,已经引起了工业界和学术界的广泛关注。其中,V2X安全通信是研究热点之一。然而,V2X技术的发展也引发了许多安全和隐私问题。为了解决这些问题,大量面向V2X通信的认证协议被提出。本文首先详细介绍了V2X通信的标准模型以及车联网的特点,并根据其特点分析了认证协议设计中需要满足的安全需求;对近几年的V2X认证协议进行了分类,并分析了各类协议的优缺点;讨论了面向V2X通信的认证协议的未来研究方向。
在网络空间靶场中构建真实的网络场景,是开展科学研究以及网络攻防研究的基础条件,而在靶场环境下对真实的网络行为模拟,是构建网络场景的主要技术之一.本文针对网络靶场下,
科技时代的到来丰富了人民的日常生活,线上购买物品已经成为了一种新的趋势,但随着网络用户的增加,物流配送成了一大难题.本文提出了利用Kmeans算法与蚁群算法的特性,先对客
本文在LEACH算法的基础上,引入节点剩余能量、节点到汇聚节点的距离和区域内节点密度等因素。利用网络最小能量来求解出最佳的簇首节点个数,动态设置每个节点的选举阈值。仿真实验表明,本文改进算法相较于LEACH算法和其它改进算法可以有效地降低网络能耗,延长网络生命周期,提高汇聚节点接收数据包量。
在金相组织检测环节中,需在不同放大倍数的显微镜下提取晶粒聚集区域并计算参数。使用传统DBSCAN聚类算法进行聚集检测时,因每张图像晶粒聚集的密度不同、显微镜放大倍数不同等问题,需要反复实验以确定DBSCAN算法的两个基本参数。针对上述问题,本文提出一种改进的自适应DBSCAN算法,通过平均晶粒大小,确定领域密度阈值(MinPts),利用自适应的方式调整领域半径(Eps),并采用k-d树数据结构加速
方面提取是情感分析中的关键步骤,随着互联网的快速发展,短文本数据迅猛增加,对短文本数据加以整理和利用极为重要。本文针对短文本的特殊性,提出了短文本模型WESM。与现有模型不同的是,本文引入了词汇共现网络,丰富了词汇的上下文信息,针对中文数据,引入了cw2vec模型,能够充分利用中文词语的语义信息;为了提高短文本的上下文语义缺失,引入了自注意力机制,能够丰富模型的上下文语义信息,提高方面词汇权重,在词汇聚类过程中,降低了非方面词汇的影响。相较于传统方面提取算法性能有着显著的提升。