面向社会网络应用的人物关系抽取方法研究

来源 :西藏大学 | 被引量 : 0次 | 上传用户:freddyzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人物关系抽取是信息抽取领域的热门研究方向之一,指的是从非结构化或半结构化的文本中识别用户感兴趣的人物关系,并以结构化的形式进行存储的过程。在这个信息爆炸的大数据时代,需要信息抽取技术快速准确地发现形式多样的人物关系,为社会网络及其他相关领域的应用研究奠定基础。本文对基于堆叠降噪自动编码器的人物关系抽取方法进行了深入研究,并在此基础上对基于人物关系抽取技术的社会网络构建方法进行了研究,主要研究内容归纳如下:首先,提出了基于互动百科的人物关系语料自动生成系统的设计方案,对数据抓取、网页正文抽取、文本分析处理、人物关系语料生成四个模块进行了详细的论述与设计;提出了由语言技术平台(LTP)和NLPIR汉语分词系统相结合并协同互动百科进一步确认的人名对识别算法以及基于互动百科的人物关系类型识别算法。其次,研究了基于堆叠降噪自动编码器的人物关系抽取方法,并通过实验的方式对该方法的性能进行了评估。在句子级别的人物关系抽取中,针对特征词过少导致特征向量高度稀疏这一问题,提出了基于同义词词林扩展特征词规模的缓解方法;考察了词特征、词性特征、相邻位置特征、依存句法特征和语义特征对人物关系抽取性能的贡献;探究了不同网络深度的堆叠降噪自动编码器的人物关系识别效果。最后,研究了基于人物关系抽取技术的社会网络构建方法,构建了适合大规模社会网络分析应用的社会网络矩阵并通过社群图的形式对社会网络的构建效果进行了展示。本文提出的基于互动百科的人物关系语料自动生成系统,为后续的基于堆叠降噪自动编码器的人物关系抽取模型的参数训练以及性能测试所需的语料提供了一个语料自动获取工具;提出的基于人物关系抽取技术进行社会网络构建的方法适用于利用大规模互联网数据进行社会网络构建,为社会网络的进一步分析应用奠定了基础。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
德国教育家第斯多惠说:“教学的艺术不在于传授的本领,而在于激励、唤醒、鼓舞。”数学教师应从学生的生活经验和已有知识出发,创设生动有趣的情境,激发学生的学习动机,培养
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
本文通过对《中共中央关于加强党的建设的意见》文件的梳理,结合党支部实践经验,从开展党政理论学习的指导基础、党支部组织工作中理论学习的实践基础、理论学习的目标分析、
地方经济是我们党执政兴国的重要物质基础和政治基础,必须毫不动摇地坚持新时代中国特色社会主义道路。党的政法工作要认真学习贯彻习近平新时代中国特色社会主义思想,牢记总
目的:研究腰麻硬膜外联合麻醉(CSEA)、患者自控静脉镇痛(PCIA)在老年微创全髋关节置换术(MISTHA)中的作用.方法:将80名年龄在60~78岁的老年患者随机分为A,B组,每组40名,A组行CSEA,术后PCIA
朱熹不仅是南宋的理学宗师,也是一位优秀诗人。本文以其在福建武夷地区创作的诗歌作为研究对象,在前人研究成果的基础上,立足具体文本,结合宋代特定的历史政治环境、学术思潮
为了有效地实施应用型本科人才的培养计划,针对流体传动技术课程的知识结构特点,从教学实际出发,对该课程的教材建设、教学内容、教学方法和手段以及实践性教学进行了改革,激发了
目的了解医院各科室环境卫生学监测的消毒质量现状,为控制医院感染提供依据。方法对全院各诊疗区域的空气、物体表面、医务人员进行采样监测。结果 2010年共采样801份,合格67