【摘 要】
:
在现实生活和网络世界里,每时每刻都会产生数量庞大、种类丰富的图像数据,给这些图像标注分类费时费力。因此,在机器学习领域,针对无标签图像的聚类分析是一个研究难点和热点。由于图像本身特征维度很高,对于图像聚类分析而言,图像特征的提取和高维特征的降维对聚类结果有重要影响。虽然人们已经提出了许多成熟的特征提取方法,但是这些方法关注的是图像的低层特征,很少同时关注图像的中间层特征。实际上,图像的中间层特征往
论文部分内容阅读
在现实生活和网络世界里,每时每刻都会产生数量庞大、种类丰富的图像数据,给这些图像标注分类费时费力。因此,在机器学习领域,针对无标签图像的聚类分析是一个研究难点和热点。由于图像本身特征维度很高,对于图像聚类分析而言,图像特征的提取和高维特征的降维对聚类结果有重要影响。虽然人们已经提出了许多成熟的特征提取方法,但是这些方法关注的是图像的低层特征,很少同时关注图像的中间层特征。实际上,图像的中间层特征往往包含重要的判别性信息,可以起到丰富图像特征表达、提高聚类精度的作用。其中,语义特征作为一种中间层特征,便于理解表达,广泛应用于图像检索、自然语言处理等领域。因此,本文将语义特征引入图像聚类任务,通过图像低层特征和语义特征的有效结合,提高图像聚类的效果。由于图像的低层特征具有较高的维度,而且低层特征和语义特征的结合容易造成维度灾难,为了达到高效聚类的目的,既要实现两种特征的有效融合,又要降低图像的特征维度,因此,本文提出一种基于深度语义嵌入的聚类算法(Deep Semantic Embedded Cluster),该算法首先将图像的低层特征与语义特征进行拼接融合,然后利用特定结构的深度自编码实现语义特征的嵌入,并对图像特征进行降维,最终利用得到的低维特征实现图像高效聚类。在特征拼接融合方法的基础上,进一步改进提出一种加权叠加融合算法(Weighted Superposition Fusion Algorithm),这种方法能够明确的衡量两种特征对于聚类的贡献程度,以此来分配不同的权重值,从而提升聚类性能。在多个图像数据集上的实验结果表明,本文提出的融合语义特征的图像聚类效果更明显,比之前单一特征下的聚类精度提高了约三个百分点,说明通过融合语义特征可以有效提高图像聚类的性能指标。
其他文献
在机器学习领域中,传统监督学习假设一个学习对象只对应一个概念标记。而在现实生活中,一个学习对象可能同时隶属于多个概念标记。比如,一部电影可以同时被标记为科幻、动作和美国等;一张图片也可能被同时标记为木屋、树木、草坪、小路等。多标记学习是研究此类问题的一种学习框架,受到许多研究者的青睐。然而,现有多标记学习算法存在两个问题:一方面,标记个数多且语义信息复杂,标注多标记数据需耗费大量人力和时间,难以获
模数转换器是模拟信号转换为数字信号过程中的关键器件。随着信号处理对带宽和精度需求的提升,对模数转换器的采样率和精度提出了更高的要求。电模数转换器(eADC)性能已经接
汉宋兼采思想是清朝中后期兴起的一种兼容考据学与义理学的新型学术思想。清中期以前,汉学和宋学一直是中国思想发展史上较为瞩目的两种治学路径,它们也在不同的历史阶段发挥了各自的作用。乾嘉以还,社会环境较之前已大有改变,而传统学术在此时也似乎很难继续前进下去,学术界迫切需要一种新的思想来挽救当时的社会困境。浙江作为中国最先接触西方先进思想的地区之一,无疑会产生一些具有与时俱进思想的先进学者,部分浙江学者在
汉字是一种形音义结合的文字,是汉语的载体,也是对外汉语教学中的基础内容。然而,汉字笔画的复杂性,使得许多汉语学习者逃避汉字,试图以学习拼音回避学习汉字的方式来学习汉语。拼音在汉语学习中固然有着重要的作用,但是,大量汉语教师在教学过程中都能发现这样一个问题,仅学拼音使得学生的汉语基础极其脆弱。因此,即使学习汉字是一个难题,我们也应知难而上,缓解困难,解决问题。笔者在泰国进行对外汉语教学时,对现阶段汉
1936年,日本为侵略西南地区,强行在成都进行非法设领,此行为遭到了川籍民众的反对。川籍民众在上海等地成立反对设领团体,四川本地民众成立反对设领大会进行宣传。8月24日,四川民众与日本人在成都爆发冲突,最终演变为成都事件。成都事件爆发后,中国地方政府和中央政府都极力控制事态,希望成都事件成为地方事件尽快解决,并将事件责任推给了共产党。但是日本政府和日本民众都认为此事可以借题发挥,以此与南京政府交涉
蓝相液晶通常存在于各向同性相和手性向列相之间的一段狭窄的温度范围内(自然状态下为1~2 ~oC),可视为一种自组装结构的三维光子晶体。相比于传统的向列相液晶材料,蓝相液晶
铸铁和碳钢作为工业生产中应用广泛的铁碳合金,具有价格低廉、良好的铸造性能、切削加工性、减振性等优点,但在复杂应力的使用环境中,材料表面易出现磨损、变形甚至断裂。本文采用激光熔覆技术,在HT250灰铸铁和T10钢表面预置Cu-Ti-Ni混合粉末,制备Cu-Ti-Ni复合涂层。通过X’Pert PRO PANalytical型X射线衍射仪、S-3400N型扫描电子显微镜、4XCJZ金相显微镜等,分析了
人脸吸引力是遗传心理学和认知心理学的一个重要命题,研究结果可以给人脸进化(以及人类进化)提供科学依据。结合计算机的人脸吸引力研究可以完善传统研究方法存在主观性强、数据少的不足。在人脸吸引力的研究中,确定人脸模板是首要任务。本文基于迁移学习,提出了一种新的人脸吸引力人脸模板,在人脸模板基础上提取了三种表征人脸吸引力的几何特征,实验结果表明了人脸吸引力人脸模板是合理可行的。具体研究内容如下:(1)在人
周予同是中国经学史学科的缔造者,他在五四运动后投身于经学史研究,著述颇丰。其《皮锡瑞<经学历史>注》、《经今古文学》等著作都是中国经学史的必读书目,也是近代经学史研究的滥觞之作,对于民国时期的经学史、学术史研究乃至现代学术都有着非凡的开拓与奠基意义。周予同的学术研究在新中国建立前后曾发生过转向,其经学史领域的基础性研究大多集中于民国时期。新中国建立后由其一手创建的中国经学史学科也是以这
随着全球定位系统应用的普及,轨迹数据早已应用于人们日常生活中的各个领域。轨迹分段是轨迹数据挖掘中重要的预处理过程,合理有效的轨迹分段结果有助于理解和使用轨迹数据。然而,目前应用于轨迹分段的方法只能针对特定的应用领域及轨迹数据集。本文基于轨迹数据的语义特征,提出一种可适用于多种应用领域的轨迹数据分段方法,之后结合该轨迹分段方法分别构建一种轨迹语义标注框架和一种交通量预测模型。主要内容包括:(1)提出