话题关联识别中报道信息的动态扩充研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:wanming2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
话题关联识别用于判断新闻报道对流中每对中的两篇报道是否描述了同一个话题。为解决其中报道篇幅短小、稀疏问题严重及其内容存在漂移等问题,提出了一种动态信息扩充技术,用于改进报道表示模型。该技术用过去最新的话题相关报道来扩充当前报道,动态更新原有模型。此外,还研究了扩充信息的精化问题,通过有选择地加重一些重要特征的权重来减小扩充过程中噪音带来的影响。该方法在TDT4中的中文语料上进行了实验,结果表明动态信息扩充技术能够较大幅度地改进话题关联识别的性能,对多种特征采取的精化技术也对性能改进产生了较大影响。
其他文献
LKM后门作为Linux下危害最大的恶意代码,运行在内核层,比传统技术下的后门更隐蔽,功能更强大。本文分析LKM后门的技术原理与威胁,并在此基础上研究各种后门检测方法。这些方法都
糖尿病前期是由正常糖耐量向糖尿病转化的重要环节,及时采取措施进行干预可有效延缓甚至截断前期人群向糖尿病的转化。目前针对糖尿病前期的治疗多以一般生活方式干预为基础,
与经典模糊集相比,直觉模糊集具有更强的表达能力和灵活性。针对直觉模糊集的模糊推理,将经典的模糊集的模糊蕴含式拓展到直觉模糊集中,提出基于扩展二值逻辑的直觉模糊集下各种
针对现有神经网络集成研究方法在输入属性、集成方式和集成形式上的不足,提出一种基于特征提取的选择性神经网络集成模型-NSNNEIPCABag。该模型通过Bagging算法产生若干训练子
糖尿病属于慢性代谢性疾病,患者的疾病特征为高血糖,而导致患者高血糖情况的发生与其机体胰岛素分泌缺陷有关,患者机体胰岛生物功能出现受损,还有些患者以上两种情况同时存在
目的探讨金纳多联合巴曲酶对突发性耳聋患者的临床应用效果。方法回顾性分析2017-01—2020-06间遂平县人民医院收治的152例突发性耳聋患者的临床资料。依据用药方法分为巴曲
在基于对等网络的Netshot路由模型的构架下,通过选用节点间不同的组织方式来形成不同的网络形态,对这些网络结构中节点的加入、删除、消息通讯等一系列操作的开销进行推导和验
为缩短查询响应时间和提高决策支持能力,数据仓库中存储了大量的实化视图,视图更新成为影响系统整体性能的一个重要因素。本文分析了现有方法处理大规模视图更新的不足,提出一种
图为无三角正则图,它满足不相邻的顶点恰有两个公共相邻顶点。先从代数的角度去研究它的特征值,得到了它的顶点个数只能取一些特殊的整数,然后证明了其点连通度与边连通度相
我们常常说中国革命像一艘航船,乘风破浪,奋勇向前,驶向胜利的彼岸。而梳理中国共产党的历史,人们会惊讶地发现,党领导的革命的一些重要节点都有船的影子,是一艘艘大船小船、木船铁船、新船旧船搭载着革命者驶过湖泊,渡过江、河、海,取得一次又一次胜利。  1921年7月,13名中共一大代表以“北大暑期旅行团”的名义从全国各地会聚上海,在望志路106号一个小小的寓所召开中国共产党第一次全国代表大会。正当代表们