评论文本的对立观点摘要的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zxc99zxc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
评论文本含有大量信息,是进一步数据分析的重要数据源。由于网络文本的爆炸增长和评论文本本身的信息冗余性,不能有效的利用评论文本,从中获得有用信息。评论文本的对立观点摘要是很重要的课题。  评论文本的对立观点摘要包括输入数据的预处理、评论文本主题和情感属性的计算、评论文本的基于主题特征的分类、评论文本向心强度的评估和对立观点摘要的生成6个步骤。  LDA适用于分析文本的主题属性,TAM适用于分析文本的主题和情感属性。本文利用TAM模型对评论文本进行建模,用吉比斯采样对该模型进行参数估计,实现了评论文本的主题和情感属性的计算。  本文实现了basic LexRank、Comparative LexRank和Biased LexRank算法,提出并实现了Topic-sensitive TF-IDF LexRank,Topic-sensitive TF-IDF&ComparativeLexRank以及Biased&Comparative LexRank算法。Topic-sensitive TF-IDF LexRank算法利用评论文本具有多重主题的特征,修改了TF-IDF的计算方法,使该算法对主题属性敏感。Topic-sensitive TF-IDF&Comparative LexRank以及Biased&Comparative LexRank算法考虑了评论文的主题和情感属性,使其对主题和情感敏感。Comparative LexRank和Biased LexRank算法分别对情感和主题敏感。  实验表明,采用Topic-sensitive TF-IDF&Comparative LexRank为评论文本向心强度算法的TAM-TC LR摘要算法效果最好,生成的对立观点摘要质量最好。  
其他文献
本文主要针对多变光照条件下以及多光照、多表情、多姿态并存情况下的人脸识别技术开展较为深入的研究。在多变光照条件下,根据人脸面部对称性及LPQ具有光照不变性的特点提出
车牌自动识别系统通过图像处理和分析,管理海量车牌数据集,自动识别字符信息,在智能交通系统中占有重要地位。但对于实际拍摄中主观人为或者客观气候等原因造成的模糊情况,以
基于视频的目标跟踪算法作为计算机视觉的重要研究方向之一,在智能交通、人机交互、生物医学以及军事领域取得了广泛的应用。但是大量的不确定因素严重影响了跟踪算法的准确率,如:光照变化、尺度变化、形变、遮挡、旋转、背景干扰等。在以无人机为相机载体进行视频跟踪时,由于目标与相机距离远,拍摄到的目标和背景特征不明显,导致跟踪变得更加艰难;而在雾霾严重的情况下,无人机跟踪更是无法实施。近年来,由于核相关滤波具有
学位
磁共振成像(MagneticResonanceImaging,简称MRI)具有较高的软组织对比度与空间分辨率,并能根据需要灵活选择成像参数与成像层面,已经广泛应用于临床。然而,由于磁共振信号的弛豫
数据挖掘是目前人工智能和数据库领域的热点问题,是指从大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的过程。聚类分析是数据挖掘领域中的重要技术之一,是数据分析的
复杂性科学是以复杂系统为研究对象的多学科交叉的前沿科学。复杂性科学的发展,将会给方法论带来突破和创新。对复杂系统的演化与涌现机理的研究是复杂系统研究的重要内容。
本文以静态数字图像作为研究对象,以基于特征点的第二代水印算法作为核心,着重研究抗几何攻击的数字水印算法。针对Harris算子提取的特征点在图像尺度变换后重复率低,特征点分布
信息隐藏技术在计算机各个领域有着深入广泛的应用,正是由于互联网络的快速发展,保密通信、版权保护、盗版追踪等安全需求也愈发重要和紧急。不同于密码学,信息隐藏技术的目
网格计算是随着互联网的发展而兴起的一门新兴技术,它将地理分布、系统异构的各种资源,如高性能计算机、大型服务器、大型通信设备等,通过计算机互联网络连接起来形成一个无缝的
在图像真实性检测领域,基于语义进行图像真实性的检测是一个比较新的研究点,该问题涉及了图像识别、特征提取、机器学习、本体构建、推理规则等众多学科领域。本文针对基于语义