Hadoop平台下加权马氏距离的Web大数据分析研究

来源 :电视技术 | 被引量 : 0次 | 上传用户:xiaozhi_1100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web大数据具有数据量大、数据异构性强、挖掘难度大等问题,针对如何提高Web大数据聚类分析准确性并保证数据分析的时效性,本文提出一种基于Hadoop平台和加权马氏距离的Web大数据分析方法。该方法在基于Hadoop平台架构上首先对Web大数据进行预处理和数据切片,然后通过计算得到方差贡献率并作为马氏距离计算的权重,最后通过加权马氏距离计算对数据判定聚类。仿真实验表明,所提方法可以有效地保证Web大数据聚类分析的准确性并具有较高的时效性。
其他文献
针对控制系统中由于存在限幅而产生的环绕现象,提出了基于模糊逻辑的抗环绕补偿器设计方法.对所设计的模糊补偿器和传统的基于反计算思想及基于条件作用技术的补偿器进行了仿
为了提高多点温度采集系统在数据采集与传输中的实时性与便利性,提出了一种基于PCI-9113A数据采集卡,C++Builder环境下,运用多线程技术设计出了一种制药罐温度监测系统.实践证明,该
稀土元素由镧至镥共15个元素组成。在天然化合物中,稀土元素主要分离出3个电子(铈和铕除外)。稀土元素原子和三价离子规模的减小,导致镧系元素性质的逐渐改变。由于镧系挤压,系列
蝶骨嵴脑膜瘤为颅内良性肿瘤,占颅内脑膜瘤的第3位[1],颅内脑膜瘤中仅次于矢状窦旁脑膜瘤和大脑凸面脑膜瘤,占颅内脑膜瘤的12%[2],内侧型蝶骨嵴脑膜瘤占脑膜瘤的60%[1]。
现代开发俄罗斯北极海陆架矿产的计划,要求了解这个广阔空间的自然条件。在北极区内,永冻区(冰岩带)实质性地加重了任何工作的难度。永久冻结的经常含大量冰块的岩石构成了北极海
针对HEVC帧内预测提出一种支持所有尺寸和模式的硬件结构。提出按行(列)模式遍历方式,并利用HEVC帧内预测的参考像素选择规律设计了参考像素选择电路,同时根据不同模式和像素块之
浅层气的直接证据可以通过地球物理调查、钻井泥浆、海底沉积物和底水样品的地球化学分析获得。间接证据可以通过海底沉积特征、气体渗漏、与甲烷有关的碳酸岩结壳、异常生物
据1995-2003年SIRRO计划的研究成果,喀拉海是研究河流一海洋体系相互作用过程独一无二的地区。巨大的西伯利亚叶尼塞河和鄂毕河注入这个浅海。1995-2003年科学研究船“鲍利斯&
湿地作为一个特殊的生态系统,在维持生物多样性、调蓄洪水、降解污染物、调节气候等方面发挥着重要作用。总结概括了当前湿地生态系统中有关地球化学研究的现状,包括湿地生态系
目的探讨肿瘤患者血清细胞质胸苷激酶(TK1)在临床应用上的意义。方法利用免疫印迹增强化学发光法,检测218例肿瘤患者血清和40例健康体检者血清的TK1水平。结果肿瘤病人TK1阳性率