基于模式匹配的大规模数据分析软件设计与实现

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:yy692451568
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分析模式匹配算法的基础上,提出了一种改进的模式匹配算法,并将该算法应用于大规模数据分析软件设计之中。在数据分析的初始阶段,通过该模式匹配算法建立一张数据索引表,随后分析软件借助于索引表和帧结构分布表,对原始数据进行分析和处理。该算法的应用,有效的解决了大规模数据处理过程中的难题,提高了大规模数据处理软件的效率。
其他文献
由于实时监控系统对视频压缩的需要,本文针对H.264标准的多模式运动估计算法编码模式复杂、计算量大的不足之处,在宏块编码模式选择统计规律的基础上,通过对纹理复杂度的分析,提出
通过一个具体的新增IPv6校园网络的部署以及路由器的端口设置、IP地址分配和各跨由器的配置,采用手动配置IPv6-over—IPv4隧道方法,实现了基于隧道原理的IPv6穿越IPv4的透明传
首先,选择合适的文本集合,并且对文本进行分词处理,然后,进行文档内部特征词的提取,通过采用词频统计的方法对文本向量进行降维处理,从而选择最佳的特征向量。最后,将非数值
逐字分词法是以汉语词典为基础对中文语句通过匹配进行切分的方法。该方法在分词中无法解决交叉歧义与组合歧义带来的问题。本文以词典分词为基础,从序列标注的角度,在逐字匹
缺少文档的开源项目和文档不完整的开源项目,分析其源代码是了解其运行机理的主要方法,本文提出一种基于函数分析顺序的分析方法,并且提出构建函数分析顺序的过程。过程为首先使
将自组织映射SOM(Self Organization Map)聚类算法应用于电信客户细分,并与采用K-means聚类算法得到的结果进行比较。实验表明,SOM可以有效的进行电信客户细分且聚类效果较优,
文章对目前网络中IP组播流媒体存在组播孤岛和不同接入带宽用户群组播数据不能共享等问题,提出了一种新的流媒体融合组播覆盖网络,研究通过P2P互联不同IP组播区,实现组播数据共
动态克隆选择算法应用于入侵检测的过程中,经过记忆检测器和成熟检测器检测后的剩余抗原被直接作为自体供未成熟检测器耐受,但这些剩余抗原并非完全是自体,有可能隐含新型攻击。
针对多个ORACLE数据库系统的主动性监控问题,提出一个基于CACTI的分布式监控报警系统。采用"一个管理端+多个代理"的监控模式,CACTI作为监控管理端,在运行ORACLE数据库服务器上
随着视频和互联网技术的发展,视频信息的存储安全问题越来越紧迫。本文针对新一代国际视频压缩编码标准H。264的编码特点,提出一种将流密码与H.264熵编码相结合的视频加密算法,通