LSTM逐层多目标优化及多层概率融合的图像描述

来源 :自动化学报 | 被引量 : 0次 | 上传用户:wei2859699
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用计算模型对图像进行自动描述属于视觉高层理解,要求模型不仅能够对图像中的目标及场景进行描述,而且能够对目标与目标之间、目标与场景之间的关系进行表达,同时能够生成符合一定语法和结构的自然语言句子.目前基于深度卷积神经网络(Convolutional neural network,CNN)和长短时记忆网络(Long-short term memory,LSTM)的方法已成为解决该问题的主流,虽然已取得巨大进展,但存在LSTM层次不深,难以优化的问题,导致模型性能难以提升,生成的描述句子质量不高.针对这一问题,受深度学习思想的启发,本文设计了基于逐层优化的多目标优化及多层概率融合的LSTM(Multi-objective layer-wise optimization/multi-layer probability fusion LSTM,MLO/MLPF-LSTM)模型.模型中首先使用浅层LSTM进行训练,收敛之后,保留原LSTM模型中的分类层及目标函数,并添加新的LSTM层及目标函数重新对模型进行训练,对模型原有参数进行微调;在测试时,将多个分类层使用Softmax函数进行变换,得到每层对单词的预测概率分值,然后将多层的概率分值进行加权融合,得到单词的最终预测概率.在MSCOCO和Flickr30K两个数据集上实验结果显示,该模型性能显著,在多个统计指标上均超过了同类其他方法.
其他文献
笔者从事教育工作多年,对于历届学生的思想的变化有着深刻的体会。大学生是国家的未来,祖国建设的主力军,大学生是否健康发展深刻的影响着国家的发展方向,大学生的思想和人格
当前我国广大农村地区正处在城镇化的发展进程中,农民是城镇化改革的主体,在改革中扮演关键性的“钟摆”角色,他们对于改革的态度至关重要。如果农民从思想上不能认同改革,甚
目的:通过黄芪建中汤加味治疗功能性肛门直肠疼痛(脾胃虚弱证)的临床试验研究,观察其临床疗效和安全性。方法:将成都中医药大学附属医院门诊收集的符合功能性肛门直肠疼痛诊断
国家工作人员"礼金腐败"损害了职务行为的廉洁性,危害社会公平。现行刑律并未将其纳入调整范围,引发苍蝇式腐败担忧,将官员收受礼金入刑的呼声在我国颇有市场,《刑法修正案九
东北地区在改革开发以前作为国家重要的工业基地,为改革开放和四化建设做出了历史性的重大贡献。但是随着时间的推移,由于体制性和结构性矛盾日趋显现,东北老工业基地设备老化,竞
本论文研究了不同载体涂敷的纤维素-三(3,5-二甲基)苯基氨基甲酸酯手性固定相的制备,并在正相条件下探讨了12种中性或酸性化合物在自制手性固定相上的拆分效果,制备拆分效果良
目前跨境电商已经成为国家经济转型发展战略的重要载体,然而跨境电商人才存在培养与需求不符、社会和政府培训力量薄弱等问题。在论证高校培养跨境电商应用型本科人才必要性
为了研究藏族音乐、塔吉克族音乐、彝族音乐对奶牛泌乳量和神经递质水平的影响,试验选择新疆伊犁中洲公司巴彦岱牛场内产奶量、年龄、胎次相近的中国荷斯坦泌乳牛64头,随机分
本文分析了IHI摆式飞剪结构组成和工作原理,运用矢量法建立了运动学数学模型,并利用MATLAB符号计算求得了复杂的解析解,给出了重要的匀速机构速度调节关系图。
以探究化工行业三废处理及化工绿色环保发展方向为重点进行阐述,结合当下化工行业发展趋势为依据,首先分析化工废水、废气、固体废物处理措施;其次从化工行业环保技术、化工