基于优化的乘积量化的在线学习算法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:napone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的快速发展以及互联网的迅速普及,信息在互联网上爆发式增长,文本、图像、音频、视频等的发展导致表达数据需要更高的维度。为了更快速地对用户做出反应,如何在短时间内快速地在海量的数据库内进行匹配搜索并进行反馈,成为目前巨大的挑战。基于此背景下,近似最近邻(ANN)相关的算法被相继提出。其中,基于量化的搜索技术由于搜索性能高,表达能力强,占用内存空间小等优点取得了巨大的成功。但是,大多数现有的量化方法都是基于批次的模型,不适合处理流式数据,且现有的在线乘积量化模型没有对空间分解进行优化。为了解决上述问题,本文提出了一种在线优化的乘积量化(Online OPQ)模型。该模型可以动态更新量化码本和旋转矩阵,在模型更新阶段对空间分解进行优化,降低了量化误差,提高了搜索性能。由于在线OPQ本质上是一个在线模型,故在更新过程中只需用到新数据而不需要历史数据。在参数初始化阶段,采用优化的乘积量化(OPQ)算法,对码书、旋转矩阵以及计数器进行初始化,在后续参数更新过程中,当学习新数据时,在线OPQ会先将数据旋转到最优空间上,随后利用Kmeans算法的计算过程对码书进行更新,更新后便可以得到相邻的两个批次的码书,为了保证空间的最优性,本文提出引入一个修正矩阵对旋转矩阵进行更新,修正矩阵用来追踪中心点的变化,为了保证旋转矩阵的正交性,需要修正矩阵也为正交矩阵。而求解修正矩阵的过程恰好为Orthogonal Procrustes问题,通过求解该问题,可以保证修正矩阵的正交性。以此达到每次数据迭代时,对在线OPQ的更新。此外,为了衡量在线OPQ模型与传统OPQ方法学习出的码本的差异,在理论上导出了损失误差边界。本文通过在公共数据集上与基线模型进行了一系列对比实验,通过实验结果表明,与基线模型相比,在线OPQ在近似最近邻搜索上的性能更为有效,且分解的子空间越多,码书的表达能力越强,则量化性能越好,并且通过追踪中心点变化这一方法能够在模型更新过程中对分解的空间进行优化,以此降低量化误差,进一步提高搜索性能。
其他文献
研制了一种三维阵列电阻率测井教学实验系统,用于模拟钻孔地层电阻率测量的教学实验,并分析了井周异常体对测井响应影响。该系统包括仿真地层模块、井下仪测量模块和响应信息
本研究通过建立二甲苯致小鼠耳壳肿胀模型、醋酸腹腔注射致小鼠疼痛模型、家兔骨折模型,观察"乌芷跌打膏"的抗炎、镇痛、促进骨折愈合作用效果。结果显示,"乌芷跌打膏"对二甲苯所
<正> “时间可以淹没大海,但淹没不了高峰。”①一个伟大的作家,总是超越他的时代的。雨果正是这样一个作家。 雨果神秘而复杂的中国之旅,一路载满了冲突和对话的果实,这里写
期刊
目的探讨血管超声与64排螺旋CT血管造影(MSCTA)在评价颈动脉狭窄中的价值。方法 68例颅外段颈动脉狭窄患者于1周内分别行血管超声及CTA检查,共计272个节段,以DSA检查结果为金
不起诉运行机制对于落实检察官办案责任制、保证不起诉案件质量、保障不起诉效果、实现检察机关诉前主导地位,具有重要的意义。目前理论界对不起诉运行机制尚缺乏深入研究。
针对道路竣工测量中传统测量方式效率低、劳动强度大、测量信息量少的缺点,以一段竣工道路为例,在介绍三维激光扫描仪测量原理的基础上,根据制定的测量方案,采用地面三维激光
根皮苷(Phlorizin)和根皮素(Phloretin)都是植物多酚类物质,并且都具有调节血糖浓度、抗氧化、抗炎、抗癌等生物功效。根皮苷在结构上比根皮素多一个葡萄糖苷,可能会使得两者的生物活性有所差别。本文以人肝癌细胞(HepG2)为模型对象,研究并比较了两种物质的体外抗氧化活性,并对相关的分子机制进行初步研究,对于合理利用根皮苷和根皮素具有重要意义。本实验采取MTT法检测根皮苷和根皮素及油酸对
平流层飞艇为实现其长期驻空和可重复使用,需要可靠有效的环控系统实现其在升降及驻空阶段的形态和压差,该系统可称为飞艇的“呼吸系统“。鼓风机是环控系统中的关键部件,其