基于NAS架构搜索的美感模型研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:shoretxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着5G时代来临,流量和网速逐渐不是瓶颈。人们每天都通过电脑,手机不断接触大量的图片与视频。当前,电商、旅游、社交软件等每日都新增海量的图片及视频数据。如何在这海量数据中快速精准推荐漂亮的、吸引人的图片或视频封面,将极大决定相应的流量和收益。面临越来越庞大的数据,人工筛选已力不从心,让计算机去完成繁杂的图片筛选成为首选。由此,可计算美学被推上潮头并成为学者和公司聚焦的热点。可计算美学,即通过计算机学习人类的审美习惯,最终代替人类去给图片打分。一开始的大部分研究都是模拟人类审美习惯,通过捕捉人工设计的特征例如光照、亮度、色彩等作为依据,利用SVM等分类器来打分。随着深度学习的发展,研究者发现人工设计的特征并不全面,而卷积网络能捕捉到很多人类没有发现的特征。至此,卷积神经网络成为可计算美学主流的特征提取方法。然而,目前移动端的计算能力还不足以支撑大型的卷积网络,所以卷积神经网络也在发展着,出现了Inception等小参数网络。随着NAS架构搜索的兴起,让机器代替人工专家自动去发现合适的神经网络成为新的热潮。本文第一次结合了架构搜索技术与可计算美学,将NAS架构搜索引入到美感模型,通过改进的渐进式可微搜索策略,在AVA美感数据集上搜索得到了一个新的简单高效的美感模型Aesthetic Net。此外,当前大多数美学模型是以预测出一个平均分为最终的输出,通过阈值来对图像进行好与不好的二分类,本文的做法是通过输出评分的分布,来模拟多人评分的机制。在得到的Aesthetic Net基础上,本文结合美学相关理论分析与计算机视觉相关技术,提出了一些有效的改进措施。针对卷积网络参数量大的问题,在搜索上使用了深度可分离卷积模块;在观察到预测结果的分布与实际分布之间的差异,提出了自加权机制来计算损失函数;为更进一步模拟人眼的聚焦过程,引入了双维度的Attention注意力机制;考虑到图片完整性对视觉美学的影响,为克服卷积网络本身固定输入大小的弊端,使用了自适应池化来保障输入图片的原始比例,同时使用空洞卷积来扩大网络的感受野,以便在学习的时候能获取到更多的整体信息。最后,本文设计多组对比实验,分别验证了通过NAS架构搜索技术得到的美感模型Aesthetic Net的有效性以及提出的改进策略的有效性。
其他文献
随着现代社会的发展,机器人开始被用于越来越多的领域,在人们日益增长的需求与当前科学技术的发展下,室内移动机器人小车成为热门的研究方向。机器人小车的导航定位作为机器
土壤有机碳(SOC)是土壤质量的重要组成部分,在土壤质量中起着关键的多功能作用,决定着土壤的许多物理和生物特性。土壤有机碳具有高度异质性,不同碳组分对环境和管理措施的响应不同,不同土壤的碳固定特征与保护机制也不同,因此,深入研究土壤有机碳固定及其保护机制,对于更好的了解土壤有机碳提升具有重要意义。针对以上科学问题,通过收集已发表文献数据,建立具备相同有机碳分组方法(湿筛法)、相对独立的43篇文献的
口腔鳞状细胞癌(OSCC)占口腔癌的90%以上,是全球最常见的口腔肿瘤。基因在口腔鳞状细胞癌的发病机制中起着不可忽视的作用。然而,目前对口腔鳞状细胞癌分子机理的研究还不完全。为了确定与疾病相关的基因,研究人员通常会关注表达值的均值在疾病和正常之间存在差异的基因,实际上在两种不同的生物状态(疾病vs.正常)之间基因表达值的方差如果存在差异同样也具有生物学意义。方差是统计中的另一个重要衡量标准,表示数
随着科技水平的进步,随机振动问题越来越受到国内外学者的重视,通常这些问题对于结构的稳定性是有威胁的,然而具有挑战的是利用传统振动理论很难估计这些随机振动问题,随着研
模糊分析学作为一门新兴的应用性比较强的学科,尽管它仅仅只有不到五十年的历史,但其中的模糊算子和模糊控制在实际问题中的应用十分广泛,发展也极为迅速,在当今的高科技大数
最优控制问题在近年来一直是控制领域研究的热点,主要致力于研究出最优的控制策略,不仅使得被控系统达到指定目标,而且使得系统预设的性能指标达到最优。针对线性系统的二次
经过多年的人脸识别技术研究积累,正常的人脸图像中的人脸识别技术已比较成熟,并且在相关的应用场景下得到成功应用,在环境受限和用户配合情况下已经基本可以满足实际应用的
土壤是植物营养资源的供应者,制约着陆地生态系统的生产力。磷(P)是影响植物生长的主要营养元素之一,是植物生长发育和农业生产的重要保障。土壤是植物磷的主要来源,但并非所有形式的磷都能被植物直接吸收和利用。土壤磷对植物的有效性主要取决于它们在土壤中的存在形态。因此探明土壤磷素的存在形态是阐明其在环境中迁移、转化和累积过程以及生物有效性的关键,它还可以为农业生产中的合理施肥提供可靠的科学依据。本研究以三
目的:通过本研究,探究一种新的可能预示肿瘤型髋关节假体置换术后早期无菌性松动的诊断方法。当术后早期出现X线改变时,即使尚未达到诊断标准,应该警惕髋关节置换后无菌性松动的发生。方法:回顾性分析我院2010年1月至2017年3月间150例肿瘤型髖关节假体置换患者资料,对6例无菌性松动患者按照性别、年龄、原发疾病类型与未发生组进行1:2配对,对其术后影像学资料进行研究。结果:两组间年龄(45.7±26.
金黄色葡萄球菌(Staphylococcus aureus,简称金葡菌)是人类化脓感染中最常见的病原菌,可引起肺炎、伪膜性肠炎、心包炎以及败血症、脓毒症等全身性感染。随着抗生素广泛应用于