面向社交媒体的网络和内容分析关键技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wff0301
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的迅速发展,社交媒体已经不再仅仅限于在线交流,而是渗透到生活中的方方面面。社交媒体包含了海量的、具有丰富应用场景的数据,为研究社会生活提供了新的视角和工具,这是传统社会学所不具备的。为了更好地利用和分析社交媒体数据,面向社交媒体的数据挖掘技术层出不穷。网络结构和内容分析,作为社交媒体分析的两个主要方面,吸引了大量的研究者,产生了许多重要的理论和技术成果。本文从这两个方面出发,结合社交媒体在生活中的应用场景,对其中的关键技术进行了创新性的研究和探索,具体完成的工作和贡献包括以下几个方面:1.提出了一种基于超图的层次化社交网络表示模型,通过组件的增减,可以满足大多数社交网络的建模需求。针对脸书和企业社交网络,用提出的模型进行了建模和案例研究。通过对社交网络结构特性的研究,验证和分析了传统社会学中幂律分布和小世界效应等理论。2.针对社交网络中节点排名问题,结合PageRank和HITS的核心思想,提出了一种基于二部图的节点排名算法。算法能够支持两类节点和多种节点重要性度量方法的情况。将该算法应用到企业排名问题中,取得了较好的效果。通过不同的评价方法,发现该算法具有更好的排名效果。3.针对社交网络链接预测问题中,因训练集负样本数量过于庞大,而导致的训练效率较低的问题,提出了一种基于博弈的链接预测模型,通过网络生成博弈模型和其他加速策略,该方法能够在保证良好预测效果的同时,极大地降低训练集中的负样本数量,从而提高训练效率。实验结果表明,在多种社交网络和图数据上,该算法获得了比同类型方法更为优异的表现。4.针对社交媒体中事件的特征提取问题,提出了一种基于事件的主题模型,不仅能够提取事件的主要话题,还能够对事件的类别特征进行提取。基于模型抽取的特征,并结合新闻和社交媒体,对相关网络事件进行了深入的分析。利用提取的特征,对事件进行分类,其结果表明了这些特征的有效性。5.针对社交媒体中不可靠内容识别、分类和分析问题,提出了基于逻辑回归和深度学习的两种不可靠内容分类器,以及一种不可靠内容的新分类方法。首先,进行了假新闻识别,逻辑回归和深度学习模型分别展现了在不同分类任务中的有效性。由于逻辑回归模型较好的可解释性,基于逻辑回归模型提取的特征对假新闻的语言风格、情感、主观性等进行了分析。其次,新提出的分类方法能够将不可靠内容目的和可靠性评分结合起来。同样,基于逻辑回归和深度学习模型,对不可靠内容进行新分类下的识别和分析,并结合社交用户反应,获得了新的发现和模式。综上所述,本文所研究的社交媒体中网络和内容分析的关键技术,对于面向社交媒体的数据挖掘和分析工作有重要的理论意义和应用价值。提出的新模型和方法,能够被应用在实际系统中,获得更高效、准确的结果。对社交媒体中事件、假新闻等热点问题的探讨,为深入理解和解决这些问题提供了参考。
其他文献
“垃圾围村”现象严重影响了农村居民的生活与环境质量,成为社会主义新农村与美丽中国建设的巨大阻力。采用条件价值评估法(CVM)设计调查问卷,以山西省临汾市尧都区农村居民
为解决战争初期物资快速保障问题,根据我国地域特点和军队战略调整要求,提出边境地区陆基预置储备、岛礁预置储备、海外基地预置储备和海上舰船预置储备等4种储备模式,分析这
随着以技术创新为基础的竞争日益激烈,专利标准化逐渐成为企业有效的竞争策略和运营手段。专利与标准结合后,拥有标准必要专利即拥有市场优势地位,其优势地位不仅来自于客观上标准的强制性,更来自于主观上标准制定和实施阶段供需双方的信息不对称。标准必要专利的信息披露是标准制定的前提,也是确保标准顺利实施的保障。一方面,标准制定过程中专利信息披露不充分将导致标准必要专利“特洛伊木马”;另一方面,标准实施阶段标准
计算机模拟技术在材料实验教学中的应用越来越广泛,在多媒体实验室中可以用图形和动画来模拟物理、化学现象和过程,使一个复杂的过程看起来更为形象、直观、逼真。这种技术使学
目的:探索利用DAPI和Hoechst33342两种荧光染料检测DNA的流式细胞技术。方法:分别用DAPI、Hochest和PI3种荧光染料标记HT-29细胞,通过流式细胞仪检测其G0/G1期、S期和G2/M期的D
被害人申请排除非法证据符合证据排除规则的理论基础,是被害人诉讼当事人地位的重要体现之一,有利于实现刑事诉讼法尊重和保障人权的基本任务,具有正当性。但它又存在一定局
传统的税务处罚机制在程序上体现为表示行为的单方性和法律效果的既定性,在实体上表现为手段措施的单一性和非选择性。与此相比,替代性机制是不同于法定处罚机制而形成的多元
N-乙烯基吡咯烷酮(NVP)和甲基丙烯酸β—羟乙酯(HEMA)由于具有优异生理性能已经得到了广泛的应用。其中HEMA与NVP的共聚物水凝胶作为软质角膜接触透镜材料(隐形眼镜)和药物缓
帕米尔构造结是青藏高原变形最强烈的地区之一,区内新生代岩浆侵入活动发育,既有壳源岩浆侵位,也有幔源岩浆广泛分布.根据岩石学和地球化学研究,侵人岩可分为幔源碱性正长岩