基于人工智能的音视频内容检索系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:gym510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的迅猛发展激发了音视频内容制造者的创作激情,使得音视频内容得到了极大丰富。同时,这也给音视频内容的监管提出了新的要求。如何高效率地从海量的音视频内容中获取目标信息成为了音视频监管的重要课题。近年来,在AI计算芯片性能迅猛提升的背景下,包括机器学习、深度学习在内的人工智能技术得到了迅猛的发展,深度学习在计算机视觉和音频分析领域有了长足的进步。基于以上背景,本论文利用深度学习中计算机视觉和音频分析的相关技术,设计了一套基于人工智能分析的音视频内容检索系统。该系统基于人工智能的深度学习技术,应用不同的神经网络模型实现对音视频内容的特征提取以及特征向量化,并借助高维检索技术通过输入特定信息检索海量音视频内容中的对应内容;同时设计并实现了前后端分离的前端网页系统和后端服务器。其中,主要使用的神经网络模型有InsightFace、CRNN(Convolutional Recurrent Neural Network)等,神经网络模型训练的主要由TensorFlow和Keras实现;后端模块主要使用Python作为开发语言;前端使用Vue框架完成网页开发;MySQL用来完成系统全部的结构化数据存储工作。本文首先以相关领域的发展情况为依据对确定音视频内容检索这一课题的技术背景和现实意义做了详细的阐述,总结和分析了目前业界对音视频内容检索这一课题的研究进展,提出了本课题的研究内容和目标。文章从前后端核心语言、系统整体搭建工具、深度学习核心模块、搜索引擎等维度出发,介绍了使用的相关技术,包括人脸识别算法、光学字符识别算法、特征提取、高维检索等。分章节描述了整体需求分析、概要设计、功能模块划分、系统设计开发、系统测试等工作的具体细节。
其他文献
随着移动互联网的发展和智能手机的普及,视频已经成为重要的信息传播媒介,与此同时也发生了大量针对版权视频的侵权行为。如今各大视频分享网站都有海量视频数据时刻上传,采用人工手段进行视频审核已经力不从心。为了保护视频制作公司及原创者权益,急需通过自动化方式进行针对视频的侵权行为检测。当前针对视频的侵权行为出现规模化、多样化的特点,使视频版权检测面临挑战。传统的视频版权检测技术无法应对种类繁多的侵权方式。
胃癌是指源自于胃黏膜上皮细胞的恶性肿瘤,是最常见的消化系统恶性肿瘤之一 [1],其发病率和死亡率分别居于全球恶性肿瘤的第5位和第3位,约50%的病例发生在亚洲东部,在中国胃癌的发病率位于恶性肿瘤的第4位,死亡率位于第2位 [2].肝脏是晚期胃癌患者最常见的血行转移部位,其发生率为5%~14% [3].胃癌肝转移(gastric cancer with liver metastasis,GCLM)是指胃癌细胞不断生长、侵犯周围组织,通过血管随血液回流入门静脉系统到达肝脏,并在此继发生长出1个或多个转移灶,而
癌性疼痛(cancer pain)是指由癌症本身或癌症治疗所引起的疼痛.癌痛是癌症患者最常见症状之一,在66%的癌症患者中普遍存在 [1].2021年2月26日,美国国家综合癌症网络(national comprehensive cancer network,NCCN)发布的新版NCCN成人癌痛临床实践指南(以下简称“新指南”)在疼痛管理、用药安全、不良反应的处理等方面进行细节完善.
子宫内膜癌是发达国家中女性最常见的妇科恶性肿瘤.在2015年,全世界估计有31.9万例子宫内膜癌,每年造成约7.62万人死亡 [1].大多数子宫内膜癌患者在疾病早期诊断,并且具有良好的5年生存率,但仍有约30%的患者在诊断时已是晚期.对于这些晚期和复发的子宫内膜癌患者,目前的手术、放射治疗及以顺铂为主的化学治疗,疗效不佳,导致其5年生存率仅为30%~40%.临床发现,肥胖和糖脂代谢异常可能是影响子宫内膜癌发生发展的重要因素,且两者密不可分 [2].
随着信息时代的不断发展,传统的掺铒石英光纤放大器由于有效放大波段主要在C+L波段(1530-1610nm),不能充分利用光纤通信系统的传输带宽。而掺铋光纤放大器的增益带宽集中于1000-1500 nm和1600-1700 nm波段,可以有效覆盖光纤通信系统的带宽。因此制备覆盖1000-1700 nm波段的铋铒共掺石英光纤,为实现高效超宽带的光纤放大器和激光器提供了理想的有源材料。但是目前关于铋铒共
目的 探讨Micra无导线起搏器在临床中的应用效果.方法 选取2018年7月至2021年6月江苏省如皋市中医医院收治的68例拟接受Micra无导线起搏器置入手术治疗的缓慢性心律失常患者,统计手术时间、X线透视时间及Micra释放次数.对比手术前后心功能指标变化;术后随访12个月,统计患者不同时刻起搏器电学参数,随访期间置入器械相关并发症及不良事件.结果 本研究68例患者均成功置入Micra无导线起搏器,手术成功率为100.00%,平均手术时间(38.27±3.51)min,平均X线透视时间(9.68±3.
目的 探究左心耳封堵术(left atrial appendage closure,LAAC)与射频消融术对心房颤动(atrial fibrillation,AF)患者栓塞事件的预防效果.方法 回顾性分析2016年10月至2019年11月于河南省三门峡市中心医院行LAAC的AF患者20例(研究组)与行射频消融术的AF患者60例(对照组)临床资料.对比两组患者围手术期指标(手术时间、相关并发症)差异,比较术后1个月、6个月时,患者心脏结构指标、心功能指标变化,并记录随访6个月期间患者栓塞事件及出血事件及复发
目的 探讨血清炎性标志物几丁质酶-3样蛋白1(YKL-40)、缺氧诱导因子1α(hypoxia-inducible factor 1α,HIF-1α)、细胞间黏附分子-1(intercellular adhesion molecule-1,ICAM-1)在哮喘-慢性阻塞性肺疾病重叠综合征(asthma-chronic obstructive pulmoriary disease overlap,ACO)患者中的表达及诊断价值.方法 选取2018年10月至2019年6月辽宁省本溪市中心医院呼吸科收治的哮喘(
在具有不同计算和通信资源的不同物理平台上重现网络仿真实验并非易事。许多最新的网络仿真试验平台无法保证实验的时序保真度。因此,从这些试验平台获得的结果可能会产生误导,尤其是在没有足够的物理资源来运行实验的情况下,可复现性非常重要。本文提出了一种新颖的仿真技术,可以保证网络仿真的结果可复现。本研究开发了一个原型系统,它利用虚拟时间扩展和精心控制的虚拟机调度功能,虚拟时间扩展允许扩展足够的资源在虚拟时间
目的 探讨前庭性偏头痛患者血清5-羟色胺(5-hydroxytryptamine,5-HT)、一氧化氮(nitric oxide,NO)、基质金属蛋白酶-9(matrix metalloproteinase-9,MMP-9)、降钙素基因相关肽(calcitonin gene-related peptide,CGRP)水平变化及临床意义.方法 选取2018年7月至2020年7月山东省滨州市第二人民医院收治的186例前庭性偏头痛患者作为病例组,选取同期健康体检对象100例作为对照组,对比两组患者的血清5-HT