基于集成学习的社会网络正负链接预测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:shizhongshan_2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着在线社会网络的不断发展和计算机系统处理能力的不断提高,社会网络分析和挖掘成为热门的研究领域。大部分对社会网络的研究集中在只有正链接的网络,本文研究对象为同时拥有正链接和负链接的符号社会网络。在符号社会网络中,正链接用来表达积极的含义,如朋友关系和信任关系;负链接用来表达消极的含义,如敌对关系和不信任关系。正负链接预测是符号社会网络分析的一个重要方向,具有许多现实的应用,如朋友关系推荐,用户态度推测。为了提高符号社会网络中正负链接预测的性能,提出了一种基于集成学习的方法。相比较于现有的基于监督式学习的方法,该方法从三个方面进行了改进。首先,在特征向量构造阶段,对已有的特征进行了扩展,构建了尽可能多的特征来提供更多有用的信息。其次,符号社会网络中的正负链接分布不平衡,正链接的数量远多于负链接的数量,为了解决分布不平衡对预测性能的影响,提出了基于k-means聚类的欠采样方法来处理不平衡问题。最后,不同于现有的基于监督式学习的方法采用单个分类器来预测链接符号,利用集成学习的优点,将集成学习和欠采样方法进行结合,通过组合多个分类器的结果来进行正负链接预测。为了对提出的方法进行有效性验证,在两个大的现实数据集上进行了实验。实验结果表明,在精确度、召回率、F1-measure、AUC(Area Under roc Curve)等评价指标上,性能均有提高。
其他文献
随着计算机技术的普及和发展,计算机广泛应用于一些关系到国民经济和国家安全的关键领域,如金融、电信、银行、能源、军事等,对于应用于这些关键行业的计算机系统要求具有极
随着全球一体化的不断发展,学术研究不能闭门造车,需要与国外的学术界互相交流。但作为非英语为母语的英文学术论文写作者,经常会遇到一个英文句子该怎样表达才能让国外同行
近年来,随着金融、传感器网络、股票分析、气象监测等领域的不断发展,一种流动的无限的数据引起了数据库界的广泛关注,从而使数据流管理技术成为当前的研究热点。根据数据流
随着人们日益增长的个性化需求,通用搜索引擎显然已经不能满足用户的各方面需求,由于主题式搜索引擎具有效率高、专业化、目标化、准确性高、及时性、个性化等优势,能够得到越来
强化学习是一种重要的机器学习方法,其特点是通过感知环境状态信息来学习动态系统的最优策略,通过试错法不断与环境交互来改善自己的行为,并且对环境的先验知识要求很低。多Agen
随着计算机技术和网络技术的飞速发展,计算机网络带给人们的好处数不胜数,因此人民群众对信息网络的依赖性越来越强。但是有很多是敏感信息,甚至是国家机密将不可避免地吸引
随着无线通信、集成电路和嵌入式计算等技术的高速发展,由大量低功耗、多功能的微型传感器节点构成的无线传感器网络得到广泛应用,并引起科研人员的极大关注。为此,本文研究
学位
随着互联网上的信息量越来越大,传统的通用搜索引擎对信息的查找、索引越发显得力不从心,逐渐显露出“准确性差、时效性差、覆盖率低”等弊端。通用搜索引擎立意于满足用户的
无线多媒体传感器网络是一种追求感知信息类型多样化的新型传感器网络,通过使用多媒体传感器节点,它能采集音频、视频、图像等多媒体信息。由于存在多种类型的数据分组,MAC协议