面向微博的事件检测算法研究

被引量 : 14次 | 上传用户:confusion00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博以其便捷快速的信息分享方式及庞大的用户关系网络,使微博信息通过用户网络呈指数急速增长、蔓延,进一步加剧了信息、时代数据丰富而信息匮乏的矛盾。从这些海量繁杂的微博数据中梳理出具有价值的事件信息,不仅可以帮助网友获取自己感兴趣的事件资讯并掌握身边发生的新闻要事,还可以从舆论监控和民意调查的角度协助政府部门进行应急管理和行政决策。然而由于微博数据简短、不规范、新颖的特点,应用传统的网络文本分析和数据挖掘技术的效果不再理想,事件检测领域在特定的微博环境下面临了新的挑战,相关研究尚处于探索阶段,亟待寻求面向微博的有效的事件检测方法。针对微博文本的特点,论文提出了整套面向微博的事件检测模型,并对每个模块进行了详细的算法设计。通过实验证明,该模型可有效、及时、准确地检测出微博数据中的事件信息。课题的主要研究内容和创新点如下:第一,论文提出了一种基于N元关系统计的自监督特征抽取方法。不同于传统的事件检测模型,论文提出了将事件检测重点从文档转换为特征,通过微博数据自身的特点来表示微博特征,从而能更好地表达微博文本所要传递的信息,适应微博文本的特点第二,论文通过引入词激活力和词亲密度的概念,提出了一种新的词聚类方法。通过新的词聚类方法,论文成功将事件检测模型从文档聚类转换为特征聚类,从而将孤立的微博数据特征关联为有序词类进而表达检测事件。第三,论文设计并实现了一个完整有效的微博事件检测模型。基于论文提出的事件检测模型算法的创新,论文在事件检测表示、事件检测性能评测方面同样给出了相应的解决方案,为面向微博的事件检测模型各方面工作开阔了思路。
其他文献
企业网络组织在信息共享程度高低不同的情境下,其网络关系和网络结构在推动知识转移、创新的同时,由于信息不对称与个体的有限理性,使企业网络组织中的企业面临一系列的风险,
举证责任当之无愧被称为“民事诉讼的脊梁”,举证责任如何在双方当事人之间进行合理分配直接影响着当事人的切身利益与我国的司法公正。环境民事侵权作为一种特殊的民事侵权,在
语感和语感教学问题自20世纪90年代以来,成为了学术界及语文教育界关注的热点,研究者在语感的本质、语感形成的机制、语感教学的途径等方面做了较为深入的探讨,但毋庸讳言,直
为了研究大型风电场接入电网的影响,本文提出了PSS/E中的风机建模方法。以PSS/E32版本中的双馈式感应风力发电机(DFIG)模型为例,进行了风电场特性及其并网的相关研究。首先对
在漫长的社会发展过程中,高利贷问题一直相对较为敏感的话题,在高利贷是利是弊、能否入罪以及如何进行监管等方面也有很多学者提出了不同的观点,尤其是在我国法制体系不断完
目的1.描述癌症患者宗教应对的自身调节以及宗教应对的体验。2.解释癌症患者宗教应对的现象,提高人们对癌症患者宗教应对的理解与认识;为癌症患者循证护理实践提供科学的理论依
<正> 赋税和徭役是封建国家剥削和奴役农民的主要手段,是封建国家机器赖以存在并实现其职能的首要前提.马克思说:"赋税是政府机器的经济基础,而不是什么其他东西的经济基础."
目的探讨VHL综合征的临床及影像学特点,提高对本病的认识,以免漏诊、误诊。方法回顾性分析3例VHL综合征病例的临床和影像学资料,并复习相关文献报道。结果男2例,女1例,年龄27
作为一种重要的关系资源,政治关联已成为学术界研究的热点问题,通过研究可知政治关联对企业各个方面的经营活动产生了重大的影响。本文将分别阐述政治关联给企业带来的“利”与
随着电信运营商3G服务的开展,为满足个人及行业需要,电信增值业务种类不断丰富,包括手机新闻和资讯,飞信和飞聊,手机位置服务,以及基于移动互联网的移动邮件等服务,电信增值