基于Semi-CCA的自动图像标注研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:luoweitao2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,信息获取和信息存储能力的不断提高,从海量数据中获取我们感兴趣的信息成为当前研究的热点之(?)同样,在计算机视觉和图像处理及模式识别领域,图像检索也成为重要的研究方向之一。在早期,因为数据量并不十分庞大,人们考虑使用基于文本的图像检索方式,这种检索方式,优点是检索准确且直观。然而,随着信息量的指数级增长,对图像进行手工标注,工作量巨大,且存在因为不同标注者主观感觉不同导致的标注二义性。于是,基于内容的图像检索方式被提出并得到了很快发展,它主要是从图像中提取低层特征,包括颜色、纹理、空间关系等,然后计算图像之间的特征相似性,找到对应图像。这种方法灵活,丰富,但是也存在一个很大的问题,就是“语义鸿沟”,即相同或相似的低层特征往往对应完全不同的高层语义特征。为了解决这个问题,人们提出了基于自动图像标注的检索,用与图像检索等方面。这种方法核心是学习一个已经标注好的图像库,找到图像低层特征和标注词之间的对应模型,再用该模型,计算出最适合待标注图像的关键词。于是,基于标注的图像检索就转换成了已经发展成熟的基于文本的图像检索了。本文,借助于统计学中的典型相关分析工具,可以得到标注库中标注词向量组和图像低层特征向量组之间的相关性,从而得到投影的特征向量,再使用k-means聚类,得到若干概念类,将概念类中的图像进行分割,提取这些区域的低层特征,继续进行k-means聚类,这样,每一个概念类中,得到若干特征相似的块blob,最后,利用多伯努利模型,就可以计算的到块bi与每个关键词之间的联合概率分布表。对于待标注的图像,首先进行基于改进的JSEG算法的图像分割,对分割的每个区域,提取贡献最大的低层特征的Semi-CCA投影,找到区域所属于的块,结合已经得到的联合概率分布表,我们就可以找出最合适的标注词了。
其他文献
以差分分析为基础,Biham等人于1999年提出了不可能差分分析模型,该方法利用概率为零的差分路径对分组密码进行密码分析。反观线性分析领域却还没有利用零相关线性逼近的密码分
新辅助治疗联合手术是一种非常具有医学前景的食管癌临床治疗策略,综合其有效性和安全性,新辅助放疗可作为重度食管癌、不可切除食管癌的治疗手段,新辅助化疗在腺癌中治疗价值更
肺癌在我国人群中的发病率和死亡率较高,非小细胞肺癌约占所有肺癌的80%左右.表皮生长因子受体(EGFR)药物靶点突变主要集中在18 ~21号外显子上,研究发现G719X、L833V均为罕见突
[摘 要] 要素投入结构的调整是供给侧结构性改革的核心内容之一。劳动(人力)要素作为生产的要素之一,对于促进经济社会持续发展起到决定性作用。地方本科院校是为区域经济发展输送人才的主要渠道,地方高等教育为区域经济发展提供智力和技术支持,是牵引区域经济发展的引擎。本文结合供给侧结构性改革背景下辽宁经济转型发展过程中的人才需求情况,分析辽宁地方本科院校发展的现状和问题,并提出辽宁地方高校转型发展的方向和
大数据时代背景下,数字媒体信息大量的通过网络传输,数据信息高速传输的同时,数据安全问题也越来越受到人们的重视。数字图像较传统文字信息所表达的信息量更丰富多彩、内容表达
目的:分析沉默信息调节因子6(SIRT6)及survivin表达与胃癌患者临床病理学特征之间的关系,探讨其在胃癌中的作用。方法:选取2013年3月至2014年10月西安交通大学第一附属医院收
由江苏省人民政府主办,国家工业和信息化部支持,中国纺织工业联合会协办,江苏省经济和信息化委员会、江苏省纺织工业协会共同承办的第十七届江苏国际服装节将于9月11~13日在
以信息化带动工业化,大力推进信息化与工业化融合的进程中,企业内部建立了大量的应用子系统,逐步形成了信息孤岛、信息非结构化、重复开发等问题,亟待需要解决。而企业信息门
CAESAR认证加密方案竞赛是在全球范围内征集认证加密方案的竞赛,目标寻找到有优秀的安全性并且高效的认证加密方案。CAESAR竞赛对认证加密方案有众多的特征需求,如抗初始向量重复使用,中间认证码,可在线加密等。本文针对这些特征需求进行了深入分析与举例,并探究如何实现认证加密方案中比较重要的几项需求。作为CAESAR竞赛的参赛者之一的LAC是独特的状态泄露式认证加密方案,本文找到了在初始向量重复使用
灌区信息监测是提高灌区现代化管理水平的一个重要内容。传统的灌区信息监测系统呈现出单点、有线和本地的特点,难以实现灌区尺度的信息监测。利用现代水利信息化技术,及时获