论文部分内容阅读
随着手机的广泛普及以及通信技术的快速发展,移动通信渐渐成为人们日常生活中一个不可或缺的部分。而对于移动业务,短消息是手机使用中最频繁的一种联系方式,因为价格便宜并且快捷方便。手机使用量的飞速增长使得移动网络中的短息量激增。如此海量的通信方式也带来一些隐患。一些不法分子通过短消息进行联络:例如法轮功分子利用短信散布谣言,不法分子利用彩信发送色情图片以及淫秽视频剪辑,台独分子散发包含民国或其图像的彩信消息等等。这些信息不仅成为国家政治的不稳定因素之一,并且对青少年的健康成长是非常不利的。为此本文提出了一种过滤手机彩信图片中敏感文字的框架及方法,并对两种不同图片中文文字内容分析的方法进行实验与比较。本文取得的初步研究成果可以概括如下:对于多媒体短消息业务进行简要介绍,其中包括多媒体短消息业务的概念、实现结构以及原理,并基于现阶段的多媒体短消息平台提出了一个具有可实施性的监控系统框架。回顾多媒体短消息图片过滤的现状,并且对垃圾邮件图片过滤方法进行调研用来与多媒体短消息过滤方法对比和融合。对所提出的系统框架中图片敏感文字过滤方法进行详细设计,并且在基于PC机搭建仿真平台以及DEMO演示系统。介绍了基于HARR特征的背景去噪方法以及基于特征融合的手机彩信预处理技术,其中包括B样条插值,边缘噪声、椒盐噪声的去除以及图像形态学处理技术,并将此方法应用于该过滤方法中。基于此过滤系统,提出一种基于SIFT特征的模式识别统计分类方法。介绍了用于图像中文字内容分析的图像匹配方法——SIFT匹配与模板匹配方法,并且嵌入此系统加以实验对比并根据实验设计方法生成一级字库3775的训练图片集,收集试验正样本500幅、负样本500幅,并将这些数据用于实验得出结果并对系统性能加以分析。综上所述,本文工作主要是以自然场景及非常自然场景的图片文字检测与内容分析为中心,对多媒体短消息中图片敏感文字过滤系统的设计以及各模块设计与实现做了探索与研究,搭建演示系统,并取得一定的理论研究成果。