论文部分内容阅读
近年来,随着互联网和新媒体技术的飞速发展,网络上的数字媒体越来越多,人们在充分享受数字化和互联网带来便利的同时,也面对着这些数字媒体遭受作品版权被非法使用而带来的市场秩序混乱的问题。由于数字媒体易于复制、分发和快速传输等特点,随意传播受保护的数字媒体的现象普遍存在,数字媒体的盗版侵权现象也越来越严重,因此对数字媒体进行版权管理和保护,保障数字媒体版权所有者的合法权益已经成为目前国内外研究和探讨的重要课题,对该课题的研究具有非常重要的理论和应用价值。 利用基于内容的媒体指纹检索技术进行数字版权管理是一种新颖的模式,为了进一步提高媒体指纹检索技术在海量数字媒体版权管理上的应用效果,本文针对图像媒体,深入研究和探索面向数字版权管理的海量媒体指纹检索关键技术。本文的主要贡献和创新点如下: l、提出了一种自适应位分配哈希检索算法 局部敏感哈希算法是一种流行的快速近似最近邻检索算法,其具有检索效率高和空间占有量低的特点。为了提高哈希算法的检索精度,本文通过深入分析各种哈希算法的优缺点,提出了一种自适应位分配哈希算法。该算法差异性地对待数据的不同维度,如果数据在某个维度上离散度较大,平均而言,该维度对于欧氏距离的计算将是主导性的,本文提出的哈希算法将自适应地分配较多的位数来编码该维度,使得该维度的编码在汉明空间中对于汉明距离的计算也是主导性的。同理,如果某个维度的离散度较小,本文提出的哈希算法将自适应地分配较少的位数来编码此维度。实验结果表明,利用本文提出的哈希算法,使得经过编码之后在汉明空间中的数据能够比较好地保持原始欧氏空间中的数据的近邻结构,从而提高了哈希检索算法的精度。 2、提出了一种自适应位分配积量化检索算法积量化是一种基于向量量化的快速近似最近邻检索算法,它克服了向量量化中需要大容量的码本来取得比较高的检索精度的缺点。本文对向量量化算法,尤其是积量化算法进行深入研究和探索,提出了一种自适应位分配积量化算法。该算法能够根据积量化算法中子空间的能量不同而自适应地分配不同大小的码本去量化各个子空间,来保证在整个空间中的量化误差最小。整个空间的码本由子空间码本的笛卡尔积构成。为了求得最小量化误差下的最优位分配(码本大小分配)策略,本文采用了贪心算法来高效地求解目标函数。实验表明,在相同码本大小下,该算法不仅能够取得更小的误差,从距离估计的角度还能够取得比其他积量化算法更小的偏差和方差,从而能够得到更高的检索精度。 3、提出了一种基于哈希和向量量化结合的层次检索算法 针对哈希检索算法和向量量化检索算法各自的优缺点,本文提出了一种结合哈希检索算法和向量量化检索算法的层次索引结构。首先基于哈希检索算法效率高的优点,先利用哈希检索算法进行过滤,剔除大部分不近邻的数据,然后基于向量量化检索算法检索精度好的优点,利用向量量化检索算法对哈希检索算法召回的数据进行第二次检索,将向量量化检索算法的结果作为最终的检索结果。实验表明,在海量媒体指纹数据下,该层次检索算法在效率不明显降低的情况下,能够取得比哈希检索算法更高的检索精度;同时在检索精度不明显降低的情况下,取得了比向量量化检索算法更高的检索效率。 4、搭建了数字版权管理服务平台 本文研究的海量媒体指纹高效检索技术将为数字版权管理服务平台提供必要的技术支撑。应用本文的研究成果,我们参与搭建了数字版权管理服务平台,通过基于哈希和向量量化结合的层次检索算法实现了海量媒体指纹的高效检索服务。数字版权管理服务平台主要用于实现对海量媒体资源的集中管理,其核心功能包括:数字媒体作品指纹(特征)提取、数字媒体作品版权登记与备案、数字媒体作品高效检索等。在已有的技术基础上,本文还开发了PC端数字版权管理应用软件和Android移动端数字版权管理应用软件。