【摘 要】
:
2010国内移动互联网进入快速发展阶段,但随着互联网公司介入及基于应用商店模式的终端厂商的快速加入,电信运营商出现数据业务收入增速放缓的困境,面临被管道化的威胁。同时
论文部分内容阅读
2010国内移动互联网进入快速发展阶段,但随着互联网公司介入及基于应用商店模式的终端厂商的快速加入,电信运营商出现数据业务收入增速放缓的困境,面临被管道化的威胁。同时随着移动互联网应用的普及化,电信运营商存储的数据规模从GB级迈向TB级甚至PB级。在商业竞争中,通过数据分析辅助经营已成为有效的手段,但传统的数据分析架构已经不能适应这种海量数据处理和快速、深度挖掘的需求。Hadoop这种大数据处理框架为解决上述问题提供了一种新的思路。在此背景下本系统的设计与实现作为陕西电信大数据平台建设项目的预研。课题通过构建处理电信数据的Hadoop平台系统,探索通过Hadoop平台的离线技术实现对每日百亿级数据的清洗、分析和挖掘的可行性;建立仿真的BI前端系统通过上述处理的数据进行套餐的分析,优化流量套餐设计;实现从访问、搜索、通话时长、短信使用量等行为构建了用户分析体系,多维度定位用户兴趣偏好并形成客户画像;为电信服务部门建立决策系统。本文首先分析了Hadoop框架结构以及所用到的HDFS和MapReduce技术,然后对Hadoop平台上数据的采集,数据的存储进行阐述;重点分析了利用MapReduce技术进行并行计算的方法;将处理之后的数据存放在HDFS文件系统当中,并通过Sqoop组件将处理完的数据转存到关系型数据库中。本系统的前端BI设计采用J2EE的开发框架,并进行了详细的设计,在后台数据处理的基础上完成了流量监控功能、运营支撑功能、客户画像功能、决策支持功能,在决策支持功能的实现中采用了聚类算法。在实验室环境下进行开发环境的搭建配置,并分别进行大数据集的数据传输和Hadoop下的离线数据处理以及前端BI的展现的测试。系统运行正常有效,该预研表明基于Hadoop平台能够满足电信数据预处理和数据存储、数据分析的需求。
其他文献
船舶推进轴系校中安装效率和精度关乎船舶建造周期和质量,针对传统安装方式依赖环境条件和施工人员的工程经验,存在周期长、精度差、效率低的问题,为提高轴系安装的自动化程度,设计了一种用于空间位姿调整的智能支架系统。对用于轴段位置和姿态调整的智能支架系统进行了详细解读,对运动机构的组成情况和各部分功能作了概述,分析了运动机构通过直线导轨和电动缸的配合运动实现轴段位姿调整的工作原理,阐述了该智能支架系统的控
改革开放以来,我国揭开了干部人事制度渐进式改革的序幕。大致经历了思路形成、试点和法规形成、制度创新和实施、制度完善和发展四个阶段,逐渐形成了具有中国特色的国家公务
为了解近期我国华北地区猪繁殖与呼吸综合征病毒(PRRSV)的流行及变异情况,本研究对该地区某猪场采集33份2016年~2017年疑似患PRRS猪病料样品进行PCR检测,对阳性样品进行病毒
现代兽医针灸疗法的研究与应用概况*陆钢陈武于船(中国农业大学,北京100094)中国兽医针灸术源远流长。据新石器时代砭石的出现,距今约有8000年的历史。现代兽医针灸疗法有些是近廿年来运用现
根据共代谢过程的特点 ,详细推导建立了一个以关键酶为中心的综合性数学模型 .模型不仅包括传统的基质降解速率和微生物生长 ,而且包括关键酶的诱导 ,毒性抑制和自我恢复 ,以
为实现气象资料缺乏情况下参考作物蒸散量(ET0)的精确模拟,利用川中丘陵区3个气象站点1999-2013年的逐日气象资料作为输入量,以FAO-56 Penman-Monteith模型计算的ET0作为标准
为认真贯彻落实《国务院办公厅关于转发国家发展改革委住房城乡建设部生活垃圾分类制度实施方案的通知》(国办发[2017]26号)精神,加快推进生活垃圾分类工作,日前,北京市发布
意大利作为欧盟重要成员国,同我国保持着在欧盟国家中最为稳定的双边关系。近年来,发达的意大利主流媒体对于发展全面战略伙伴关系的中国尤为关注;特别是随着我国国际地位的
国外休闲服装成为服装业发展的主流CasualWear-PredominantTrendonApparelEvolutionAbroad从1995年起,许多国家和地区人们喜爱穿休闲服装,这一趋势正在继续。并有服装设计师预言,世界服装业的将来,定是休闲服...