基于异质数据融合学习的在线问答社区欺诈检测研究

来源 :南京财经大学 | 被引量 : 0次 | 上传用户:wuyan68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线社区问答(Community Question Answering,CQA)网站已经吸引了众多参与者在互联网上分享知识和获取信息,成为广受大众欢迎的交流平台。然而,随着众包系统的快速发展,许多恶意用户利用众包平台组织针对CQA网站的共谋攻击,参与任务的账号通过发布诱导性问题和欺诈性答案,推广他们的目标(产品或服务)。通过这些众包任务,可以完全操纵问答内容,并聚合成多个合谋问答(Q&As)欺诈群组,从而控制用户的情感倾向,左右用户的决策,进而影响CQA社区问答的整体环境,使其公信度大大降低。有关识别CQA欺诈内容的工作已有大量研究,其中大多数方法提取问答文本信息及其发布者用户的行为特征,使用二元分类器来检测识别欺诈问答和正常问答。总的来说,这些方法几乎都基于这样的假设,即问题与答案彼此不相关,可以独立地检测识别。然而,真实在线社区问答并不是独立出现的,很多问答是在众包任务驱动下发布的,彼此之间具有关联性,且欺诈特征并不明显,使得以往的研究工作针对这些合谋性质的欺诈性问答的检测性能效果不佳。为了应对这些挑战,本文提出了一个基于异质数据融合学习的在线问答社区欺诈检测框架(Spam Detection Framework based on Heterogeneous Data Aggregation Learning in CQA,SDHDAL)。具体地,本文深入研究了众包任务的活动流程,总结了合谋攻击的欺诈模式,将其建模为问答中关键词的共现,然后使用余弦模式挖掘的方式来提取欺诈模式及问答群组。在此基础上,从个体和群体两个层面提取高区分度的问答属性,并建立问答之间直接和间接的依赖关系,然后将问题、答案、属性、依赖关系建模为属性异构信息网络(Attributed Heterogeneous Information Network,AHIN)。其次,利用集体分类(Collective Classification)思想,提出一种AHIN上的迭代式检测算法,该算法基于有标签问答,融合问答特征以及依赖关系问答的标签属性,对无标签问答进行标签预测、迭代更新及分类操作。最后,利用百度知道(Baidu Zhidao)收集的真实问答数据集,对提出的SDHDAL方法进行了性能评估,实验结果表明该方法对于合谋欺诈性问答检测是有效的,准确性Precision方面高达88.5%,综合指标F1-Measure方面达到87%,并且优于许多已有方法。
其他文献
新时期,为了全面加强小学班主任管理水平,作为班主任要重视科学地开展心理健康教育工作,通过结合小学高年级班主任心理健康教育工作实际,探索了当前小学班主任心理健康教育现状,分析了提高小学高年级班主任心理健康教育水平的措施,希望分析能进一步为学生日后发展奠定良好基础。
期刊
随着教育体质改革的推进,小学生心理健康教育成为素质教育的主要内容,得到广大教育工作者的关注。在小学班主任心理健康教育中,结合实际的教育工作,从小学生心理特点出发,针对性优化心理健康教育开展策略,坚持从"以人为本"的观念出发,协调各方教育力量,建立良好的小学班集体,促进小学塑造完整的人格。本文将以浅谈小学班主任工作中的心理健康教育为主题,从以下几个方面进行详细的分析。
期刊
随着新兴的区块链技术的出现,智能合约正面临着极大的安全隐患。仅2019年上半年就有24%的区块链用户遭遇过隐私数据泄露事件,隐私数据保护问题日益成为人们关注的焦点。随着区块链用户数量的不断增加,隐私数据泄露的问题也愈发严重。在使用智能合约的过程中,姓名、住址、电话号码和出生日期等个人隐私数据不经意间被智能合约收集,在缺乏对其保护的情况下容易发生泄露问题,给个人隐私安全带来隐患。本文主要针对当前智能
学位
中国是人口大国,粮食问题关系到国计民生。随着物联网时代的深度发展,粮食领域积累了大量数据,然而当前对粮食数据,尤其是非结构化数据的分析利用仍存在一定的困境。在粮库安全生产事故分类方面,依赖人工经验以及标准导则,往往耗费大量人力与财力,也极易出现误分类的结果;在粮食领域的基本问答方面,百度、谷歌等搜索引擎返回的内容冗杂,用户无法第一时间找到自己需要的答案。知识图谱是整合海量数据、反馈数据内涵的有效手
学位
叶脉模式是植物的主要特征之一,不同级别的叶脉在植物生长和发育的过程中有着不同的分工,各级叶脉的特征以及各级叶脉之间的层级关系可以表征叶片和植株的不同的生理和基因信息。叶脉分割是叶脉模式分析的前提,对于植物生长和基因研究、植物品种鉴别、生态环境分析有着非常重要意义。现有的叶脉分割方法都是基于传统的图像分割技术,一般聚焦于叶脉的粗粒度分割,即把叶片分割看作为一个二分类的图像分割任务,而忽略了对叶脉的层
学位
伴随现阶段国民生活水平的持续提高,人们对建筑质量的要求在不断提高。地基基础与桩基础都是建筑施工活动的重要组成部分,影响到工程的整体质量。所以在建筑地基基础和桩基础施工中,相关人员有必要采取更为科学合理的方案,做好对施工全流程的管理控制,以此来充分保障施工质量和施工效率。本文将会充分联系实际情况,分析建筑地基基础以及桩基础的施工处理技术,以期望能够为相关单位提供参考作用。
期刊
W6Mo5Cr4V2(M2)高速钢因其良好的红硬性和耐磨性,常用来制造复杂的切削刀具。但随着加工技术的快速发展,切削加工速度和精度不断提高,对切削刀具提出了更高的要求。在高速钢表面制备性能优异的涂层被认为是改善其性能的最有效最经济的方法之一。为进一步提高M2高速钢表面等离子熔覆制备的Ni Cr Cu涂层的红硬性,在Ni Cr Cu合金粉末中添加了不同含量的Co,选择Co添加量为20 wt.%(Co
学位
观看电影是人们在闲暇时间里的一种主流娱乐方式,当前随着互联网的发展,各种网络电影点播网站是人们观看电影的一种新途径,通过它,人们足不出户就能方便地观看到世界上的绝大部分电影,然而影视行业的蓬勃发展导致各类影视资源的数量不断增多,出现了电影资源的“信息过载”问题,网络电影点播平台如何能有效地帮助用户发现符合其个人偏好的电影是一个需要解决的问题。推荐系统技术很大程度上缓解了电影信息过载的问题,协同过滤
学位
锆钛酸铅[Pb(Zr,Ti)O3]压电陶瓷由于具有互相转换电能和机械能的特性以及优良的压电响应和温度稳定性,已被应用在许多电子设备中(例如,马达、超声波电机、传感器、换能器等)。但是,Pb基压电陶瓷含有超过60%的氧化铅,这可能会损害人类身体健康和污染生态环境。因此,开发无铅压电陶瓷以替代各种电子器件中的铅基元件是实现可持续发展的重要举措之一。本论文主要通过化学改性(稀土离子掺杂)的方法制备了改性
学位
近年来,随着城市建设脚步加快,高层建筑工程项目越来越多,高层建筑施工技术等相关问题引起业界广泛关注。高层建筑工程施工中,桩基础施工技术是最为关键的一环,决定了高层建筑结构的安全与稳定,对提高建筑施工质量起着积极的作用。鉴于此,文章研究了高层建筑工程桩基础施工技术相关问题,分析了施工过程中的常见问题,指出了提高桩基础施工质量的关键点,并对桩基础施工技术应用进行论述,以供参考。
期刊