基于依存句法的图像描述文本生成

来源 :北京航空航天大学学报 | 被引量 : 0次 | 上传用户:asd710601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述文本生成是计算机视觉与自然语言处理交叉领域的研究热点。现有深度学习模型能够应用词性序列和句法树使生成的文本更符合语法规则。然而,上述模型生成的文本多为简单句,在多样性和句法复杂度方面,尚未取得突破;在语言模型促进深度学习模型的可解释性方面,当前研究甚少。将依存句法信息融合到深度学习模型以监督图像描述文本生成的同时,可使深度学习模型更具可解释性。图像结构注意力机制基于依存句法和图像视觉信息,用于计算图像区域间关系并得到图像区域关系特征;融合图像区域关系特征和图像区域特征,与文本词向量通过长短期
其他文献
针对传统YOLOv3算法中存在检测框定位不精确的问题,提出了一种改进的YOLOv3算法用来重新估计检测框位置,提高智能汽车在雾霾交通环境下的定位精度。首先运用图像去雾算法对采集到的图片进行预处理,然后构造定位置信度替代分类置信度作为参考项来选择估计检测框位置,并且改进了非极大值抑制(NMS)算法,引入soft-NMS(软化非极大值抑制)以及最后使用加权平均的方式来更新坐标位置,以达到提高定位精度的
期刊
现有基于孪生网络的单目标跟踪算法能够实现很高的跟踪精度,但是这些跟踪器不具备在线更新的能力,而且其在跟踪时很依赖目标的语义信息,这导致基于孪生网络的单目标跟踪算法在面对具有相似语义信息的干扰物时会跟踪失败.为了解决这个问题,本文提出了一种异步相关响应的计算模型,并提出一种高效利用不同帧间目标语义信息的方法.在此基础上,提出了一种新的具有判别性的跟踪算法.同时为了解决判别模型使用一阶优化算法收敛慢的
期刊
以2年生西洋参幼苗为试验材料,采用盆栽控水的方法,研究5种不同土壤水分处理T1(5%~10%);T2(10%~15%);T3(20%~25%);T4(30%~35%);T5(35%~40%)对西洋参生长和生理特性的影响。结果表明:随着土壤水分含量的增加,西洋参幼苗叶片叶绿素a、类胡萝卜素、总叶绿素含量先升高后降低,叶绿素b含量呈逐渐降低趋势;随着水分胁迫的加剧,根系活力逐渐降低,叶片中丙二醛(MD
期刊
以pH为5.38、6.54、7.16和8.11(pH5、pH6、pH7和pH8)的黑钙土为研究对象,室内恒温培养89 d(于培养的第0、1、4、7、14、21、28、42、89 d取样),研究氮肥(尿素、磷酸二铵)添加对黑钙土氮素转化及酸度的影响。结果表明:施加尿素处理下不同酸度黑钙土中铵态氮含量、硝态氮含量、硝化速率和矿化速率分别为对照处理下的5.77~6.57倍、2.00~2.88倍、3.41
期刊
目标跟踪是一项有挑战性的计算机视觉任务,在智能交通、人机交互、视频监控等领域有重要作用。目前已经出现诸多性能优越的跟踪算法,但是在煤矿场景下实现良好的跟踪效果,依旧存在较大困难。主要面临着遮挡严重、背景干扰较多、井下人员较多、数据集样本数量少、缺乏统一标注等挑战,严重影响着目标跟踪的效果。本文针对煤矿场景下,矿井视频数据集不完善、图像质量低以及缺乏统一标注等情况,设计一种无监督的方法训练目标跟踪模
期刊
为探究西部风沙区采煤沉陷裂缝对土壤表层含水量(0~20cm)的影响,以神南柠条塔煤矿某工作面为研究区,使用TDR对动态裂缝以及不同宽度的地裂缝进行了土壤的水分含量监测,结果表明:(1)在动态裂缝整个发育周期内,裂缝周边表层含水量呈现处一个先快速下降后缓慢上升的趋势,且相对出塌陷侧的含水量损失量小于相对出露侧;且裂缝相对塌陷侧含水量及含水量恢复速度稍大于相对露出侧;在裂缝相对出露侧的土壤含水量受影响
期刊
研究陶瓷晶粒尺寸分布对估计陶瓷样品的物理属性具有重要意义, 当前主要依赖人工方法测量晶粒尺寸, 由于晶粒形状不规则且大小不一, 因此人工方法测量效率低、误差大. 针对该问题, 提出一种数据与模型联合驱动的陶瓷材料晶粒分割算法. 该算法首先通过图像预处理解决材料表面反光导致的灰度不均匀问题;其次利用本文提出的鲁棒分水岭变换实现图像中晶粒的预分割, 解决传统分水岭算法存在的过分割以及分割区域个数与轮廓
期刊
To solve the safe horizontal transportation by rail & road of remote sensing satellite problem in the process of unpredictable dynamic load, a high attenuation vibration isolation damper (hereinafter
期刊
识别多尺度目标和遮挡目标是目标检测中的重点和难点。为了检测不同大小的目标,目标检测器通常利用卷积神经网络的多尺度特征图层次结构,然而这种自顶向下的结构由于底层特征图的卷积层较小,缺乏获取小目标特征所需的细节信息,因此这些目标检测器的性能受到了限制。为此,本文结合Faster R-CNN框架提出Collaborative R-CNN,设计了一种级联网络结构,可以融合多尺度特征图,以生成深度融合的特征
期刊
电力物联网终端设备容易受到身份伪装、信息窃取、数据篡改等多种安全威胁,传统的安全方法无法抵御来自受损终端的网络内部攻击,信任评价体系是保护电力物联网终端免受内部攻击的有效机制。针对电力无线专网通信终端信任问题,提出一种基于信息熵的信任评价方法。首先通过基于指数分布的信誉度的模型估算直接信任值,然后采用滑窗与遗忘因子对直接信任值进行更新,根据熵理论度量直接信任值的不确定性,并引入间接信任值弥补直接信
期刊