基于代价敏感学习的不平衡虚假评论处理模型

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:zeroii
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的] 增强虚假评论识别任务中模型对文本深层语义信息的学习,并解决虚假评论识别任务中存在的严重的数据不平衡问题。[方法] 基于数据本身的用户行为特征与文本特征进行类间可分性计算自动学习代价敏感矩阵,增强模型对不平衡数据的学习能力;同时利用BERT在文本编码方面的能力对模型进一步优化。[结果] 通过在YelpCHI数据集上进行大量实验,对比现有先进方法,所提模型的F1值得到了18%的提升,AUC值得到了12%的提升。[局限] 将所提方法应用到更多的研究领域中有待进一步探索。[结论] 将用户行为特征与评论文本特征看作虚假评论类与真实类之间的特征集合进行类别可分性计算能够有效增强模型对虚假评论识别的性能。
其他文献
基于熊彼特创新理论等理论,以2010—2019年沪深A股重污染行业上市公司为样本,通过规范和实证研究相结合的方法,分析研发投入对企业价值的影响以及股东责任在二者间关系的中介和调节作用。结果表明:研发投入可以促进企业价值显著的提升;股东责任在研发投入与企业价值之间起中介作用,企业进行研发投入,可以通过履行股东责任,提升企业价值;股东责任在研发投入与企业价值之间调节作用显著。
现代管理学认为,企业文化对企业核心竞争力的培育起着至关重要的作用,文化就是明天的经济。不仅国内外各大公司纷纷建立专门部门来从事企业文化的建立和执行工作,小公司也越来越重视企业文化所带来的巨大影响。然而,企业文化建立好后也不是一成不变的,它受到时间和空间、内部和外部的诸多因素影响,科学的企业文化观念应当是不断的自我更新,甚至是不破不立的。因此,在公司发展进入新阶段时,如何优化出更恰当、更具特色的企业
采用在高阶精度差分格式对SA湍流模型和SST湍流模型及相应的可压缩修正模型在高超拐角流中进行了评估。可压缩修正方式考虑了密度梯度、压力膨胀和湍流马赫数等方法。为了减小数值误差与模型误差之间的混淆,控制方程的对流项采用了5阶精度的加权紧致非线性格式(WCNS-E-5),粘性项采用了一种半结点/结点交错的4阶中心格式。通过对马赫数为9.22的15度拐角和34度拐角湍流的模拟,考察了原始湍流模型及其修正
<正>随着元宇宙的搭建技术从游戏产业溢出,探索元宇宙机遇的人愈发多了起来。文旅产业集聚了人类文明的瑰宝,在元宇宙线上入口被互联网巨头抢占的情况下,文旅产业成为元宇宙的线下流量蓝海。在此背景下,人工智能产业创新联盟、赛迪教育联合《人工智能》杂志主办了元宇宙与文旅产业、元宇宙产业发展趋势与行业机会两期线上讲座,讲座由上海市人工智能行业协会协办,亚马逊云科技、HTC VIVE战略支持。听行业专家解读元宇
期刊
菲律宾某岛屿住宅及商务区开发项目,面积约180 hm~2,标书要求采用菲律宾标准设计。国标一般的学习参照者为欧美日发达国家,其降雨量及降雨强度实际上普遍低于菲律宾这样的热带雨林国家。通过介绍遵照菲律宾标准确定雨水系统的参数,对比国标的异同点,为完善国内雨水系统设计,降低内涝灾害提供一定的参考。
<正>10月15日,美国陆军宣布与萨博·博福斯动力公司签署了一份为期7年、价值8 700万美元的合同,用于采购"卡尔·古斯塔夫"M3E1型无后坐力炮,并从2021年开始交付。据悉,M3E1其实就是"卡尔·古斯塔夫" M4型无后坐力炮的美军编号。"卡尔·古斯塔夫"无后坐力炮自上世纪40年代末问世至今,经过70年发展已经形成一个完整的系列产品,性能得以不断提高。此次美国陆军价值8700万美元的采购合同
期刊
海参具有极高的营养价值,但由于存在自溶酶,捕捉后的海参会发生溶解,根本无法长期储存与运输。为此采取干燥保存,相比热风干燥,微波干燥对于海参的储存具有一定优势,能很好地保存海参的营养与风味,且产品复水率较高。基于正交试验设计思想,开展海参微波干燥最佳因素水平研究。进行因素主次要分析、因素显著性分析和事后的水平显著性检验。根据不同因素的响应均值及影响因素主次要地位,估计可能的最佳的因素水平组合,并且在
目的 探讨将快速康复外科护理联合精细化护理应用于腹腔镜胃肠手术患者手术室护理中的效果。方法 选取2020年1月—2021年4月广州市第一人民医院南沙中心医院接受腹腔镜胃肠手术治疗的患者130例作为研究对象,按照随机数字表法将患者观察组(n=65)与对照组(n=65)。对照组采用常规护理,观察组采用康复外科护理联合精细化护理干预,对2组胃肠蠕动功能、术后恢复情况、生活质量、心理状态及并发症发生情况进
在形位公差的圆度和球度误差评定方法中,最小区域法是最符合国标中定义形位误差的方法之一。针对目前基于最小区域法建立的数学模型以及相应的求解方法存在局部收敛以及求解迂回等问题,建立了圆度和球度误差评定的鞍点规划模型,并基于鞍点规划理论的最小条件建立了鞍圆和鞍球面误差求解的新算法,通过简单几何分析和有限代数计算即可确定符合最小区域法评定原则的圆度、球度误差以及相应鞍圆、鞍球面的位置和参数。相比于传统优化