多类别模式分类技术及其在多媒体分析上的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:leki55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体自动概念标注是在语义层次上进行视频浏览、搜索的关键技术。这方面的研究经历了两个阶段。第一个阶段使用二值分类算法检测概念集中的每个概念,并达到了一定得准确度。但是这种方法完全忽略了概念类别之间的关系。第二阶段的方法在单独检测单个概念的基础上添加了一个语义融合的步骤来通过挖掘概念之间的关联以此提高标注的准确度。但是这种方法会将第一步的分类错误引入第二步中造成“误差传播”的问题。为了解决上述问题,我们提出一种新的同时对单个概念与底层特征关系以及概念之间关系进行建模的方法,称作关联多类别方法(Correlative Multi-Label,简记CML)。我们在TRECVID数据集上与现有的算法进行了比较,并得到了满意的结果。另一方面,一般的主动学习算法可以在样本的维度上动态地构建训练集。尽管这种方法在一般的二值分类问题上取得了满意的结果,然而对于多类别问题而言不是最优的解决方法。我们认为,对于每个选出的样本,仅仅其中的一些有效类别需要被标注,而其它的类别可以通过类别之间的关系推断出来。这是因为考虑到类别的关联性,不同的类别对最小化分类误差的贡献是不同的。因此,我们提出一种通过选择样本-类别对来最小化多类别贝叶斯分类误差界的方法,我们称之为二维主动学习算法,因为它在设计主动学习策略时同时考虑了样本维度和类别维度。进一步,由于训练样本随着时间会不断增加,如果使用基于重训练策略的多类别分类器,会大大增加计算的强度。我们开发了一种高效的在线模型,它能够仅利用新到达的数据即可动态地更新当前的模型,大大提高了算法的效率。我们在两个标准数据集以及一个从Corbis网站上得到的真实数据集来测试上述的算法,并得到令人满意的结果。
其他文献
<正>2017年5月23日,由中国建设科技集团股份有限公司《暖通空调》杂志社、中国勘察设计协会建筑环境与能源应用分会北京市委员会主办的"第3届数据中心机房空调系统论坛"在北
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
如果说高山植物,纯净护肤是植物医生的一个差异化优势与定位,那么透明化公开化则应该是它的另一个不同寻常。植物医生意在通过体验馆让顾客全面了解植物医生护肤品,并对背后
本文从做好人事档案管理工作对中专实施“人才强校”战略,事业单位收入分配制度改革,中专院校的和谐发展具有重要意义着手,分析了中专人事档案管理中存在的主要问题,从增强档案意
本文分析了网络环境下高职院校图书馆用户需求的特点,有针对性地提出了满足高职院校图书馆用户需求的服务策略。
我国藏区的多民族和多宗教并存的现实特点导致了藏区容易成为宗教极端势力渗透的主要地区,藏区的社会稳定是我国国家安全和社会稳定必不可少的条件,防止藏区宗教极端势力渗透
2016年8月,历时28年的甘肃白银连环杀人案告破,利用指纹和DNA深入侦查,警方最终确定犯罪嫌疑人高承勇,在白银市将其抓获,大快人心。
一、关于风景写生  风景写生是高校造型艺术专业必不可少的课程.它能使学生直接感悟自然,置身大自然中,培养对大自然的观察力和感受力,提高选材、取景及构图的能力.……
高校图书馆利用率逐年下降成为困扰其发展的瓶颈,文章通过分析高校图书馆面临的威胁,从创新服务,培养稳定的读者群;做好宣传,巩固纸质文献的优越性;重视引导,加强书评的推广作用;更新
采编工作属于图书馆馆藏资源建设中最基本也是最关键的一项业务工作。随着信息时代的到来,图书馆采编工作也逐渐实现电子化与自动化。这对图书馆采编工作提出了更高的要求。因