论文部分内容阅读
政府机构、大型组织和企业等单位都有大量保密信息需要严格管理。在信息化不断深入的背景下,保密信息被大量电子化,使保密信息的管理变得极为困难,泄密危险极大增加。首先,本文介绍了监控系统设计目标及技术难点,快速监控词匹配和高精度的OCR识别是完成设计的核心技术,而稳定的扫描核心是完成系统的保障。之后,本文对需求分析建模与系统设计进行了说明,提出了双进程文件扫描方法,将保密信息识别任务与界面各自封装为一个进程,在每个识别进程中集成了快速监控词匹配和高精度的OCR识别等多种技术。本文还着重对相关算法进行了优化设计:1、提出了基于SQLite的在线对称式热备高速数据库,提升了系统核心数据的可靠性;2、提出了基于Trie结构的大量长关键字快速匹配算法,实现了快速匹配大量长监控词的功能;3、提出了局部自适应二值化算法,提高了保密图像二值化的效率;4、提出了高鲁棒性、高精度的新型图像倾斜矫正算法,提升了对倾斜图像中保密信息的检测精度;5、提出了低分辨率OCR算法,提升了对低分辨率图像中保密信息的检测精度;通过定量实验得出,本系统的稳定性要优于单进程,并且图像倾斜矫正算法、局部自适应二值化算法、低分辨率OCR算法比现存的算法在速度与精度等方面都有明显的优势。最后,本文完成了监控软件系统的开发,采用了防病毒软件的原理来监控保密信息在计算机中的复制、传播和变换,完成了文件扫描、USB设备监控和互联网访问监控等功能,实现了基于内容的高稳定性的保密信息监控系统。本监控系统可以为政府和企业对保密信息进行管理,也可准确、及时地自动监控保密信息的传播与扩散,防止泄密事件发生,填补了相关应用方面的空白。