基于构图规则的图像美学优化方法研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:flyfish11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类每天所接收的信息中有超过90%来自视觉,随着人们的生活品质不断提高,对于视觉媒体的美学需求在逐步增加。“构图”是影响图像美感的重要因素,它与摄影的其他要素决定了画面的鲜活程度以及叙事能力。目前针对图像美学的研究虽然隐含地考虑了简单的构图规则,但由于构图的主观性,暂时还没有可靠的自动构图分类方法和明确考虑构图规则的图像优化方法。本文的两个研究内容旨在解决上述问题。首先,对于现有构图分类模型不适用于一般快照以及限制输入图像横纵比破坏构图信息的问题,提出了一种基于空间不变性卷积神经网络的构图分类模型(简称为RSTN),该模型使用Resnet-blurpooling作为骨干网络,其中加入了我们设计的RSTN结构,使模型具有了平移不变性和旋转不变性,增加了模型对于一般快照或偏斜图像的泛化效果。为解决卷积神经网络限制输入图像大小和横纵比的问题,我们在模型中使用了自适应池化层。最终我们的构图分类预测模型准确率达到了90.8762%,较Baseline准确率提高了3%,旋转一致性提高了16.015%。进一步的,以构图分类模型作为基础,我们依据图像对编辑的敏感程度将图像分为偏斜敏感型、平移敏感型、非空间敏感型三类,针对每一类图像设计了一种构图优化方法。其次,针对目前不存在具备明确构图信息的视图推荐和局部构图检测模型,提出了一种具有明确构图信息的实时图像视图推荐模型(简称CVPN),该模型以一张图像作为输入,输出一个美学价值由高到低的局部视图序列,以及每个局部视图的构图类别。为训练CVPN,我们使用模型蒸馏方法(教师-学生架构),单独训练了两个网络,一个为上述的构图预测模型,另一个为美学评估模型。这两个模型被当作教师模型用于监督训练作为学生模型的CVPN。并且针对目前图像裁剪任务中候选框选择的挑战性问题,提出了一套基于黄金分割理论的裁剪锚框提取流程。同时构建了一个用于训练视图推荐模型的数据集VCAD,该数据集由两个不同领域的图像数据集组成,标签由两个教师模型和候选框提取算法自动标注。该视图推荐模型具备广泛应用范围,如图像裁剪、图像缩略图生成、实时摄影指导、图像局部构图分析、构图检索、相册自动管理,视频封面生成等。
其他文献
铝管是一种常用的管材,被广泛用于建筑工业和汽车产业等领域,在汽车管片式散热器中铝管即为冷却管,是汽车散热器中的重要组成部分。铝管在生产运输过程中可能会有所损坏,所以在铝管与散热片装配成散热器芯之前,铝管需要检测缺陷并分拣。目前,铝管的缺陷检测任务主要是通过人工检测来实现,但是人眼排查铝管质量的工作效率低而且难以满足工业生产的需求。本文采用机器视觉技术对铝管表面缺陷检测展开研究,利用机器视觉的高效和
利用视频监控进行行人身份识别是当前计算机视觉领域研究的热点之一,对于保障公众安全、刑事案件侦破等具有十分重要的意义。随着卷积神经网络技术在行人识别领域的广泛应用,其识别自动化程度及准确率有了明显的提高。然而通过对研究现状,发现现有的行人身份识别方法存在如下问题:现有的方法依赖于行人的外观特征,即当行人更换衣服、背包等外观特征时,这些方法的精度有明显的下降。为了解决这一问题,本文通过人体重建技术对视
人们经常使用的软件和应用程序存储和处理大量的个人数据,尤其是大数据技术的发展,个人数据的价值日益提高,从而个人数据的保护成为软件系统发展需要考虑的重要因素。每个国家和地区都有不同的法律来保护个人数据,尤其是欧盟发布的GDPR法令,提出了若干维护个人数据的规则。然而个人数据的保护并不是完全将个人的数据独立出来,这是一个双向的需求。新兴的区块链技术能够在一个不依赖于中央节点的无信任环境中实现各种去中心
在汽车胶管上安装卡扣配件的过程中,往往会因为生产环境或安装过程等因素,导致胶管上的卡扣出现个数短缺或安装位置出错等问题,从而直接影响汽车胶管间连接处的质量安全和使用性能。以往大多使用人工检测的方法进行合格检测,但由于各种人为因素导致产品检测的效率低和质量差,无法满足流水线生产的合格检测需求,故本文对胶管卡扣的检测方法进行了深入研究。本文首先分析传统目标检测算法在卡扣检测应用中存在的问题,针对传统目
行人再识别是利用计算机视觉技术,在图像或视频库中检索特定行人的任务,该任务具有强烈的实际应用需求和显著的理论研究价值。行人再识别技术目前主要依靠外观信息识别不同行人,而由于实际场景复杂多变,取得准确且鲁棒的行人再识别仍然是十分有挑战性的任务。本文的研究领域是基于视频的行人再识别,主要任务是针对行人的表观特征和步态信息进行深入研究。主要贡献如下:提出了基于表观特征聚合的行人再识别方法。相比图像而言,
数字水印作为保护信息安全、实现防伪溯源和版权保护的有效方法,是信息隐藏技术研究领域的重要分支和研究方向。在本文中,我们主要研究的是通过语音的数字水印技术来实现语音的安全认证和篡改检测。现如今,语音的水印技术已经发展出很多种,我们在本文中主要使用的水印嵌入方法是回声隐藏(Echohiding)方法和量化索引调制(Quantization Index Modulation,QIM)方法。这两种水印方法
物联网(IoT)是传感器和执行器等异构设备的集合,它们构成一个巨大的网络,使网络中的硬件组件能够组成一个更美好更方便的世界,如智能家居、智能城市、智能交通和智能产业。另一方面,安全和隐私是物联网最重要的方面,包括认证、授权、数据保护、网络安全和访问控制。另外,传统的网络安全方案由于其计算能力和存储容量的限制,不能直接用于物联网。随着云计算和通信技术的发展,用户可以访问各种环境下提供的物联网服务,包
1969年,上海学生刘月娥,和其他知青一起,胸前佩戴着光荣的大红花,一路颠簸到了安徽的茶林场。刘月娥身子单薄,刚开始干活的时候很不习惯。和她同住一屋的林娟,因为吃不饱,胃总是不舒服。于是,刘月娥尽量省下自己的粮食去接济林娟。肚子吃不饱,男知青们经常趁夜色去河边捞点鱼虾打打牙祭,到后来,鱼虾都被他们捞光了。见大家都面黄肌瘦的,连队只好同意每个星期天,让他们结伴步行,去
期刊
在现实生活中,云服务提供商(Cloud Service Provider,CSP)允许数据拥有者(Data Owner,DO)定义相应的访问约束,并且将其所需要发布的数据上传到功能丰富、计算能力强大的云服务器中,同时保证数据在服务器中的安全性。在云计算技术的支撑下,基于位置服务(Location Based Service,LBS)能够为移动用户提供便捷的推荐服务,但同时也带来了信息泄露的风险。L
随着社会发展和生活水平提高,当前群众政务服务呈现诉求多样化、服务个性化、方式便利化的新形势。政府部门也因此成为最大的信息数据生产、收集、使用和发布单位。然而,大量的数据信息由于跨部门共享机制不健全、政策制度滞后等原因无法得到充分的利用,造成了“不愿共享”、“不敢共享”、“不会共享”等问题的发生,严重影响了数据资源共享应用的整体效能。尽管在政府服务平台的研究和开发这条道路上已经有很多先行者,但是系统