论文部分内容阅读
随着现代信息技术的高速发展,教育信息化正成为当今中国教育改革和发展的重要组成部分。教育资源的建设作为一项重要的工作在教育领域引起了人们的普遍重视;教育资源的合理、有效利用在提高教学质量、推动教育信息化发展中发挥着越来越重要的作用。图像作为一种重要的信息载体,是Web中不可缺少的信息资源,也是多媒体教育资源的重要组成部分。与Internet中信息的爆炸性增长相比,信息检索的发展显得十分落后,图像信息的检索更是如此,如何从海量信息中提取出有用的图像资源成为教育工作者普遍关心的问题。本论文面向Web中丰富的基础教育图像资源,首先利用多媒体搜索引擎与网页分析程序将图像及其所在的网页下载,并对网页中图像周围的相关文本进行分析,提取与图像相关的物体名和物体视觉特征描述词,建立图像索引数据库。然后利用图像分析技术,采用基于边缘的图像分割方法,提取图像的主体区域并进行视觉特征提取与(分类)识别。最后,结合图像主体视觉特征知识库对图像的主体区域进行识别,将识别结果和视觉特征等图像内容写回图像索引数据库,实现Web基础教育图像资源的内容自动标引。论文重点研究了图像主色调提取方法、形状分类识别方法、纹理分类识别方法、图像分割方法和图像主体区域的特征提取与识别方法。利用改进的HS*B颜色空间和直方图极大值法提取主色调,利用小波变换和Gabor滤波提取纹理特征,利用不变矩等参数描述形状特征,利用BP神经网络和支持向量机对纹理和形状特征进行分类识别,利用边缘检测和数学形态学方法分割图像,根据区域面积提取图像的主体区域,采用“与或”知识表达式描述图像主体的视觉特征,建立图像主体视觉特征知识库。论文使用Visual C++6.0和Matlab6.5程序开发工具,基于Windows XP操作系统和Microsoft Access 2003数据库,开发了图像内容分析与主体自动识别系统,对从Web中下载的可能与基础教育小学课本中主题词相关的12万幅图像(包括语文、数学、社会、科学、思品与生活等),进行了图像内容分析与主体识别实验,取得了比较令人满意的结果。研究表明,在图像内容分析和基于知识库的图像主体识别中充分利用Web中提取的图像主体的语义信息能大大提高图像识别的准确率,有效改善图像索引数据库的标引深度,从而提高了基础教育图像资源检索的准确率,为有效利用这些图像资源提供了有力保障。