大数据可视化数据加载模式比较分析

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:kunan8714
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:大数据可视化是使用形象直观的图表组件显示数据分析的统计结果,一般是以web技术构建可视化应用系统,实现可视化数据提取、整理、加载到显示渲染的整体过程。该文总结分析了三种大数据可视化数据的供给模式。比较了在原生处理、框架技术和aj ax优化框架下的组件结构和处理流程。表现了三种模式之间了继承且持续优化的关系特征。
  关键词:大数据可视化.flask.echarts;node.js;网页渲染;ORM
  中图分类号:TP311 文献标识码:A
  文章编号:1009-3044(2019)36-0011-02
  1大数据可视化实现模式
  大数据可视化本文指使用echarts图表组件以曲线图,柱状图等形式显示大数据分析结果。echarts以json格式定义结构,其中的数据属性一般是javaScipt数组方式提供。例如,data:[’周一’,’周二’,′周三′,′周四′,′周五′,′周六′,′周日′],而echarts组件的完整显示效果是由json定义的属性树实现的,显示过程处理模式通常为,根据客户端查询需求,服务端生成可视化网页;网页推送到客户端;客户端加载网页时,自动启动echarts控件的生成显示代码,完成echarts图表的创建。这一过程可以利用b/s架构下http访问协议的内在特点,采用不同的设计策略,最终都是保证客户端生成显示echarts前,所需数据已经加载到初始化环境中。本文将分析三种设计策略,比较不同数据加载方式的特点。第一种采用原生模式,即在服务端完整生成客户端页面。重点是网页模板文件的替换操作。第二种是采用flask框架,网页模板文件使用渲染方式完成数据填充。第三种是更加轻便的基于ajax的二次数据加载模式。
  2基于原生模式的数据加载分析
  這里以node.js技术为例,程序执行流程如图l所示。按功能角色可分为服务器控制器、数据库访问、数据变换和网页模板加载。当客户端通过http协议发起访问,服务端流程控制器根据访问路径,定向到不同处理流程。正常情况下,会继续发起数据库访问,加载可视化的源数据集。
  加载后的数据集根据可视化数据结构要求,进行必要的形式变换,数据变换是根据需要典型分两种,一种是将数据记录集进行转置,将记录集中的列转为行,例如,绘制散点图时,一行作为x,另一行作为v轴上的数据集。另一种是将两列进行合并操作,每行形成一个2个元素的元组,如用于饼图的数据格式[ {value:335, name:’直接访问′),{value:3 10,name:′邮件营销′)]。
  数据准备完成后,可以替换掉网页模板中的占位符。可视化组件echarts的效果渲染是在网页加载阶段发生的,白启动的javascript代码段包括了显示数据的变量定义赋值、要渲染显示的echarts组件从数据源属性到各种可视化属性的定义、DOM节点挂载echarts组件完成显示。其中变量赋值内容以占位符的形式预没,直到以实际数据替换掉占位符,构建语法合法的变量赋值语句。例如:dataArr=({tpbc_res】);“((tpbc_res))”就是占位符标签。服务端以诸如fs.readFile(”./view/index.html”,function (err, data)的指令读取模板网页内容,再以实际数据替换掉占位符,如htmlData=htmlData.replace(/{{tpbc_res))/’data-Arr)。最后输出流向浏览器客户端推送网页内容数据变量re-sponse. writeHead(200, (’Content-Type’: ’text/html; charset=utf8 ′));response.write(htmlData),客户端完成加载渲染。
  在服务端推送数据替换后页面文件到客户端时,要注意页面文件中的处理,它会在客户端接收加载页面时,再次向服务端申请读取echarts.min.j文件的内容,如果不加特定处理,会将发生数据替换后模板页面文件的内容再次推送给客户端,生成错误的echarts.min.js,所以应该如下处理,if’(pathname== ’/javascripts/jquery.min.js’II pathname==’/javascripts/echarts.min.js’){ fs.readFile(pathname.substr(l), function (err, data)( re-sponse.write(data.toString(》;})。当服务端发现客户端的访问路径是所需js插件,则在javascnpts目录下读取对应is文件回送。
  3框架模式下的数据加载分析
  图2为框架模式的可视化数据加载。
  框架模式以node.js express和falsk为典型,将上述原生模式下的处理流程进一步封装成开源框架的模式。以falsk框架为例,和原生模式相比,以程序控制结构实现的服务端控制器优化成以访问路径声明实现直接路由的模式。网页模板手动加载、数据替换占位符和客户端输出进化成网页模板一次性渲染方式。数据访问也以数据映射对象的形式实现。
  数据映射对象flask_sqlalchemy是Flask Web框架的扩展,使Web服务器以ORM( Object Relational Mapping)对象关系映射的方式与数据库交互,如一个user数据库表可以通过字段与属性的绑定实现到模型的映射。
  class User(db.Model):
  ___tablename____=”user”
  id= db.Column(db.lnteger, primary_key=True)
  userName= db.Column(db.String(32》   利用数据模型对象获取数据库数据,sqlalchemy支持以对象模型集合的方式进行查询,不用编写sql语句,如User.query.filter(User. score l
其他文献
摘要:论文从APP的需求分析入手,重点阐述了基于Android的智能导购系统“优购”的使用对象、功能、市场前景等方面。该软件重要适用人群分别为消费者与超市管理者,对于消费者而言,使用该款APP不仅可以帮他们轻松地找到所需商品,而且可以为他们提供同类商品间的差异等功能,帮他们做出有效建议;而对于超市管理者而言,他们不仅可以实时查看商品销售情况,而且可以发布各种电子优惠券从而促进消费者购买欲的等功能。
摘要:近年来,研究生的数量与日俱增,在带来优质人才储备量提升的同时,也使得研究生的管理工作面临严峻挑战。新时期,如何做好研究生的管理工作,则需要把握“互联网 ”带来的便捷优势,探索思政教育新模式。本研究以此为核心,从当前研究生思政教育工作的弊端着手,明确互联网 思政教育对研究生管理的有效性,并提出管理策略,为研究生管理工作的有效性探索新方案。  关键词:“互联网 ”;新时期;研究生管理;思政教育;
摘要:随着信息技术及智能化技术的大力发展,电子工程技术在近些年来获得了飞速的进步,并且在各个行业各个领域中的应用非常广泛,也受到了更多专业领域技术人员的关注。该文以电子工程技术为研究对象,通过对电子工程技术定义、特征等内容的简单概述,指出电子工程技术未来的发展趋势,并提出促进电子工程技术发展的策略,从理论上为该行业的进步提供一定的依据,促进其更好更快地发展。  关键词:电子工程技术;发展趋势;电子
为了减轻或消除环境问题带来的生态风险后果,避免环境恶化,合理利用有效资源,进而促进城市的可持续发展,就需要对城市的生态环境进行评价来获取基础信息,鉴于此,本文利用保定市现有的2016年遥感数据和统计资料,结合研究区的实际情况和数据状况,选取了VCI、BAI、WDI、LDI4个指标构建出EI来对保定市的生态环境进行评价,研究结果表明:整个保定市的EI值为41.46,整体的生态环境状况"一般",植被覆
为了调查大学生的消费现状,以六盘水师范学院的大学生为例,采用问卷调查等方式收集相关数据,并对数据进行整理和统计,分析出六盘水师范学院大学生消费状况,为学生合理消费提
摘要:针对Android手机应用软件测试,提出了基于monkeyrunner框架的自动化测试解决方案。对于Android手机常用的测试场景给出了具体的实现方法,测试结果表明,通过基于monkeyrunner的Python脚本实现测试用例自动化,减少了重复和烦琐的手工测试,提高了Android手机应用测试的效率,节约了人力成本,缩短了软件开发周期。  关键词:Android;自动化测试框架;mone
摘要:电子政务在政府提高行政效率、推动职能转变方面发挥了重要作用,其应用系统的网络安全问题也越来越重要。该文阐述了江苏省发改委通过身份认证系统的建设,提升了其电子政务平台网络和系统的安全性。  关键词:身份认证;数字证书;PKl技术;电子政务  中图分类号:TP311 文献标识码:A  文章编号:1009-3044(2019)34-0263-01  近年来随着我国电子政务的飞速发展,信息系统的安全
摘要:针对藏文文本及其语法和词法结构,采用条件随机场进行分词,利用人工统计和标注进行停用词词典建立,然后采用tf-idf的词向量空间,予以权重计算,最后采用随机森林算法構建分类器,进行文本分类。并使用查全率、查准率和F1值三种评价函数与逻辑回归、多项式朴素贝叶斯、支持向量机三种算法相比,结果显示,随机森林算法在高维特征的藏文文本分类上优于其他分类器。  关键词:藏文;条件随机场;TF-IDF;随机
摘要:首先结合企业实际生产过程概述了WebSphere MQ、OPC数据传输原理,然后阐述了工控网、管理网运用WebSphereMQ传输OPC数据的实现过程,最后对其传输性能进行试验,通过测试分析得出以下结论:WebSphere MQ传输的最大OPC数据消息是50M;消息大小、传输用时是正比例线性关系;单通道时,触发监控器个数不影响传输用时;双通道比单通道传输用时节约较多,几乎是其两倍,但3通道、
摘要:随着山东省新一代信息技术产业发展,传统制造产业面临着巨大挑战,产品创新能力弱、科技含量低等问题显现。该文重点分析了潍坊市智能制造产业发展现状和趋势,研究了潍坊市智能制造领域内所遇到的瓶颈及制约因素,提出了潍坊市智能制造产业发展的合理对策与建议。  关键词:智能制造;瓶颈制约因素;对策建议  中图分类号:TP311 文献标识码:A  文章编号:1009-3044(2019)34-0271-02