论文部分内容阅读
信息可视化技术利用计算机图形图像和数据挖掘的技术与方法,将数据中隐藏的信息,以交互方式形象生动地展示给用户。在金融、网络通信、生物学和商业智能等领域,信息可视化技术被广泛应用于辅助用户分析数据,进而发现其中蕴含的规律。随着数据规模迅猛增长以及数据来源的多样性,传统信息可视化技术面临着新的挑战。因此,研究信息可视化技术与应用,具有重要的理论意义和实用价值。本论文主要对信息可视化技术及应用进行深入的研究,提出了针对金融数据、Web网页上的医院数据、微博数据和统计数据的可视化与分析方法,大量实验结果验证了本文方法的有效性。1.提出一种新的基于引力场聚类的金融数据可视化分析方法,为用户提供了一种快捷、方便的金融数据可视化及分析工具。首先利用无监督的自组织映射对初始金融数据进行预分类;然后在平行坐标可视化过程中引入引力场的物理模型,对平行坐标可视化的结果进行一次视觉聚类。同时,根据金融数据分析的特殊性,用户可以调节吸引力的尺度因子,亦可以对不同属性轴设置权重值,进而获得自己感兴趣的平行坐标可视化结果:为进一步增强可视化效果,采用传输函数以及交互的可视化技术,以便更好的分析初始金融数据,给予投资者一定的参考信息。为了验证本算法的有效性,采用真实的金融数据案例作为研究对象。实验结果表明,基于引力场聚类的平行坐标技术可以快捷地对公司的财务状况进行显示与分析,进而有效的对公司进行分类和排序。用户可以方便的选择出财务状况优秀和有投资价值的公司,做出投资决策。2.提出一种本体指导的Web信息提取方法,并对其结果进行可视化分析,主要思想是利用本体中定义的概念、概念属性、概念间的分类关系和非分类关系中蕴含的语义信息来进行信息提取,然后结合google map对从提取出的Web信息进行可视化显示,从而方便用户理解数据挖掘得到的信息,发现其中隐藏的特征、关系、模式和趋势等。3.提出一种基于粒子群优化算法的微博数据可视化方法,以解决在社交网络可视化中由于节点过于集中而导致难于发现节点间关系的问题。首先根据微博用户在微博中的影响力把用户分为n层,以此来表示微博用户在网络中对信息的传播影响力的等级。再基于数据的关联关系对数据进行子群划分,然后采用粒子群优化算法,设计目标函数,使粒子群优化算法适应社交网络的布局要求,并使节点的分布更加均衡,减少线段的交叉从而减少布局的杂乱度,使节点的连接关系更加清晰。为了验证本算法的有效性,采用了从新浪微博、腾讯微博中获得的数据。实验结果表明,该方法可以形成清晰的可视化结果,更好地分析微博用户之间的关系。4.提出了一种混合可视化方法,可以系统地显示统计数据,与地理信息数据相结合,更好地展现了统计数据的时空变化规律。该方法通过结合平行坐标、地理分布图、动态散点图和Treemap等多种可视化技术,并对可视化结果进行增强,方便用户能够从不同角度观察各种指标数据。同时,为了进一步对感兴趣的部分数据进行分析研究,我们设计并实现了多种可视化技术的协同交互方法。通过交互可视地挖掘空间、时间及多维属性统计数据之间的关系,达到了对感兴趣的统计数据规律的深入分析和揭示的目的。实例证明,采用混合可视化技术可以为用户提供了一种快捷、方便的统计数据可视化及分析途径。本文研究工作结合了数据挖掘、可视化分析和图形硬件技术,为解决信息可视化所面临的问题,探索了新的思路和技术手段。大量实验结果验证了本文所提方法的有效性。