面向新闻事件的人物关系分类研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:john0620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,网络人物关系已经成为舆情分析方面的重要研究内容之一。目前人物关系的判断在社交网络上较多,但是新闻人物关系的判断很少,而且这方面的研究主要是句子级别的判断,是根据含有两个人名实体的句子进行分析,并且没有考虑同事件的其他新闻,这样很难全面的获取到新闻事件上的人物关系。为了判断新闻事件的人物关系,首先需要将事件涉及的所有新闻进行聚类,对该事件涉及的所有新闻进行后续的处理,能更全面的得到事件涉及的所有人物关系,本文根据TFIDF和余弦相似度量化新闻文本描述内容的相似程度,将该相似程度和两个新闻发布时间的匹配度作为新闻事件聚类的特征,采用专家打分法为每一维特征进行权重计算,根据Single-pass算法进行聚类;接下来,对聚类后的每一个簇中的文本进行人名实体识别。根据句子的特点,包含两个人名实体的句子往往含有表达关系的词语,即人物关系关键词,因此对含有两个人名实体的句子根据语法规则提取出这个人物关系关键词。之后,对聚类簇中的每两个人物实体构建关系特征,包括实体词距特征、上下文特征等,对提取出关系关键词的人物对,及这两个人物出现在了一个句子中,利用word2vec和PCA降维算法得到了词向量特征等。然后,利用机器学习的分类模型根据特征进行人物关系分类,根据新闻的特点,新闻中人物关系主要分为家庭、上下级、合作、对立、同事或者无关系;在得到了人物关系的最后,利用Page Rank算法为每个人物的重要性进行量化分析,利用人物对的共现次数进行关系权重的计算,通过关系的类型进行群体的划分,以点表示人物,以边表示关系,同时点的大小表示人物的重要性,边的权重表示关系的权重,点的颜色表示群体,这样,构建了出人物关系图。根据单一变量原则,对选取的人物关系特征进行了特征缺失实验,通过对比整体特征与缺失某一特征的结果来证实特征的必要性;同时,对选取的机器学习分类模型进行对比试验,其中根据随机森林模型得到了81.3%的准确率。
其他文献
当前,我国反腐形势依然严峻,"打老虎、拍苍蝇"正在进行。"职务犯罪"已成为大众词汇,进入平常百姓视野。职务犯罪作为一种特殊的犯罪,侵蚀着社会和谐稳定、国家和人民的生命财
<正>平价、新潮,款式更新奇的"快时尚"方兴未艾之时,经典、怀旧、持久生命力的"慢时尚"理念也正悄然盛行。与追求以速度和新款来掳获消费者芳心的快时尚不同,慢时尚服饰追求
本文以我国10个典型城市调研数据为基础,分析居民住房租买选择意愿。一方面,运用二元Logistic模型分析城镇居民住房租买选择的影响因素;另一方面,应用影响指数法对影响因素进
2008年,是我的恩师芮沐教授100岁华诞,先生是著名的法学家,也是一位桃李满天下的教授。作为先生的学生,先生对我的教诲和关怀,使我终身受益。先生人品高尚,学问深厚,心胸开阔,身体健
当下数学教育,注重学生学习兴趣的培养,提升学习活动的有效性。把数学游戏有机的融入进课堂中,让课堂不在沉闷枯燥,增强课堂的趣味性和活泼性,本文结合小学数学教学过程中的
气质规律在教育中的应用问题越来越受大家重视。气质是指人的心理活动的动力特征。不同气质类型的人在同一活动中会有不同的心理反映。每一种气质类型(包括非典型类型)都同时
2011年国家颁布了《义务教育化学课程标准》,新课标把发展学生的科学素质定位为化学教育的主旨,而科学探究是发展学生素质的重要突破口,因而科学探究题是各地考试中的新题型,
为解决传统火工品启爆仪存在体积与质量较大、输出电压不可调,难以满足复杂起爆要求的问题,提出一种新型火工品启爆仪。采用基于超级电容模组的充放电路,阐述总体方案设计,分
随着课程改革的深化,提高课堂教学效能,促进学生的有效学习,已成为教师关注的焦点。教学有效性可以从两个角度来界定:一要从教师教学效率、教学效果、教学效益三方面来界定;