面向文本的标签云可视化度量模型的研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:opss_eagle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本是人们进行信息表述与交流的主要方式之一,利用可视化技术展现文本中的关键词信息是直观并概要地表示文本主题与主要内容的一种有效途径。对现有可视化技术进行分析与改进、研究有效的新可视化技术、将可视化技术与其它交互技术等进行融合,以及对可视化技术工具进行评测等均是当前可视化技术领域研究的重要课题。本文工作重点是研究标签云可视化技术应用于文本的度量模型,以期改进可视化技术的应用效果。根据标签云可视化技术应用于文本的原理和特点,本文主要工作内容包括如下几个方面:(1)根据标签云可视化技术应用于英文文本的原理及特点,提出了针对标签云可视化结果的五个指标,并根据提取的指标建立三级层次度量模型。用于度量的二级指标主要包括数据规模、认知复杂度、视觉效果及表现,其中数据规模包含三级指标彩信词密度;认知复杂度包含三级指标彩信词方度、方向认知度;视觉效果及表现包含三级指标色彩比重、空间利用度。根据层级度量模型的特点运用模糊层次分析方法确立各级指标的权重大小,进行层次总排序。(2)基于根据标签云可视化结果建立的指标,设计实现针对英文文本的词频计算、基于词频的单词过滤、基于停止词和单词长度的单词过滤、可视化的标签碰撞检测,以及基于词频阈值过滤的单文本和多文本处理等算法。(3)设计实现英文文本的标签云可视化指标计算,以及指标无量纲化后处理,并运用模糊层次分析法获得对文本可视化的总评分。通过对涉及相关领域内容的文本对象的标签云可视化结果进行多维度的度量分析,验证了度量模型在衡量可视化应用效果方面的有效性。实验分析表明,提出的指标值在文本信息及其标签云可视化结果之间呈现出一定的相关性,如随着彩信词密度的增加,可视化效果总评分会随之降低。当色彩比重与方向认知度在一定范围内增加时,相应的总评分会得到提高,而超过一定范围时会趋于平稳。相关的工作结果说明所完成的工作在度量文本的标签云可视化效果方面具有一定的实用参考价值。
其他文献
铁超载可以导致机体多脏器出现损伤和疾病。心肌细胞是机体重要的终末分化细胞,研究心肌细胞的铁过载毒性机制意义重大。目前,铁超载与心脏疾病的发生的机制尚未完全阐明。铁
口语是英语学习的重要内容。但是我国目前的英语口语学习者,普遍存在"不敢说""不想说""不能说""不会说"的"四不"问题。为破解这一英语教学,学习难题,在"输入假说""输出假说"
奶牛胎衣不下是奶牛产后多种常见病的一种,又称"胎盘保留"或"胎盘停滞"。奶牛胎衣不下不仅影响奶牛下一次交配和受孕率,还会导致产奶减少、繁殖力下降、严重的导致奶牛不孕,
当前,我国正深入推进国家监察体制改革,推进此项改革之直接目的就是要实现对各种腐败违纪违法、犯罪行为的有效打击,遏制腐败现象蔓延势头。虽然近年来的追赃工作有了较大的
通过对试验台的系统构成、变频器的连接和设置、能量回馈原理的描述,介绍了变频器在能量回馈系统这一特殊环境下的应用。变频器在试验过程中有电动和发电两种工作状态,两台同轴
根据朝鲜柳的生物学特性、栽培试验和相关调查结果,证明朝鲜柳具有生长快、生长时间长、生长量大的特点,是优良的速生树种,可作为速生丰产林造林树种在适宜的立地上进行大面
目的 利用吸附与解吸附的原理,通过静态吸附实验,得到AB-8型大孔吸附树脂对肉苁蓉中总黄酮具有良好的吸附与解吸能力。方法 通过动态吸附实验和正交试验得到较佳分离纯化工艺
针对电力系统低频振荡问题,本文提出一种新型低频段抑制增强的电力系统稳定器模型。该模型基于发电机机械运动模型,转速变化量经微分环节相位超前,加速功率变化量相位超前Δ
<正>博士生顾俊玲曾问恩师李锡胤:"如果有来世,您会选择什么样的人生?"先生答得干脆:"我依然会选择如今生这样的书呆子的一生。"那是什么样的一生呢?品德高洁真君子。先生是
生物间的合作行为如何在自然选择过程中显示出对欺骗者的优势,一直以来都是进化生物学上的经典问题。实验室构建的具有合作行为的微生物种群是研究这一问题的良好素材。本文