【摘 要】
:
主动跟踪系统能够主动地、有目的地调整相机参数实现目标跟踪,在大范围智能监控、大尺度移动目标跟踪领域应用广泛,如何获得目标参数,在具体应用场景中实现优化控制仍是一大难点。利用科技手段辅助体育训练正成为我国体育科研工作的热点和趋势,尤其冬季体育项目,亟需发挥科技力量提升训练质量,实现跨越式发展。短道速滑是典型的滑行技术与比赛战术高度结合的竞技项目,对训练或比赛全过程视频记录是进行训练质量评估和比赛策略
论文部分内容阅读
主动跟踪系统能够主动地、有目的地调整相机参数实现目标跟踪,在大范围智能监控、大尺度移动目标跟踪领域应用广泛,如何获得目标参数,在具体应用场景中实现优化控制仍是一大难点。利用科技手段辅助体育训练正成为我国体育科研工作的热点和趋势,尤其冬季体育项目,亟需发挥科技力量提升训练质量,实现跨越式发展。短道速滑是典型的滑行技术与比赛战术高度结合的竞技项目,对训练或比赛全过程视频记录是进行训练质量评估和比赛策略优化的关键基础信息。本文从短道速滑项目的视觉跟踪需求出发,设计了一种端到端的主动跟踪器,简化了控制系统设计;按照任务场景选取合适的强化学习训练算法;针对强化学习交互训练时间成本高的问题,开展了基于生成对抗模型的逆强化学习方法研究;并建立了满足算法训练需要的滑冰场仿真环境,在仿真环境中实现了以上方法的研究和验证,具体工作如下:针对短道速滑的跟踪环境及需求,结合当前的端到端控制方法,设计了以输入相机图像,输出相机控制信号的端到端主动跟踪器。分析并选取异步优势强化学习算法来训练主动跟踪器,并在仿真环境中进行实验,验证了主动跟踪器设计的合理性和有效性,单目标跟踪任务跟踪成功率可达到89.1%;在仿真环境背景改变的情况下,主动跟踪器仍能够完成跟踪,具有较强鲁棒性。针对强化学习算法交互训练时间成本高的问题,引入逆强化学习方法来减少训练时间。讨论分析了当前生成对抗逆强化学习的理论缺陷,结合Wasserstein距离对生成对抗逆强化学习进行改进,设计了对应的网络模型;在仿真环境中对改进后的算法进行实验,基于Wasserstein距离的生成对抗逆强化学习能够减少约50%的强化学习交互训练,并且训练过程更加稳定。课题提出了基于Wasserstein距离的生成对抗行为克隆方法,能够在不与环境交互的情况下学习专家策略,在仿真环境中对该算法进行实验,只经行为克隆方法训练得到的跟踪器具有一定跟踪性能;随后利用强化学习算法对行为克隆训练后的跟踪器进行再训练,再训练的跟踪器只需很少的交互训练即可学习到收敛的跟踪策略,因此该算法也能够有效加快强化学习训练过程。
其他文献
人类以对话的方式询问信息,当前询问的问题通常与之前的问答存在关联。然而当前的机器阅读理解任务更多是单轮问答,不同轮的问题和答案没有相关性,可以独立的求解。为了使得机器具备像人一样询问信息的能力,研究者提出对话式阅读理解任务,给定一篇文章和多轮问题,当前轮问题的回答不仅依赖于文章内容,还需要结合当前轮次的问答历史信息。本文探究融合问答历史信息的机器阅读理解技术,即在结合文章回答当前轮问题的过程中融入
随着人工智能的快速发展,卷积神经网络在自然语言处理、计算机视觉、医学治疗等任务中扮演着至关重要的角色,尤其在计算机视觉领域取得了令人瞩目的成绩,例如目标检测、特征识别、图像检索等。但是,随着卷积神经网络在应用上的愈发深入,其结构愈发复杂,模型的计算量更是指数级上升,其对算力和存储空间的要求也越来越高。在过去半个世纪,集成电路的发展受到摩尔定律的限制,硬件计算力的提升远远满足不了人们对计算力的需求。
手和手腕在人们日常的工作、学习和生活中起着至关重要的作用,人类大部分活动都离不开手的参与。因此,研制一款轻巧、灵活、便捷的假肢手/腕系统将会给上肢残疾人士的生活带来巨大的便利。一些欧美国家早在20世纪中叶便开始对假肢进行研究,我国在这方面起步较晚,技术相对落后,因此研制一款先进的仿人智能假肢手/腕系统对于提升我国假肢的研发能力显得格外重要。本文根据HIT-VI假肢手和手腕的机械结构与功能需求,设计
随着深度学习技术的进步,深度神经网络在诸多领域大量应用,其可解释性问题日益受到人们的广泛重视。目前深度识别网络缺乏数学理论支撑,存在机理不明确的问题,难以对目标识别的风险性、可靠性、适应性、鲁棒性进行准确评估,从而限制了模型的实际部署与应用。因此展开对深度识别网络的可解释性方法的研究迫在眉睫。为此本文在深入研究可解释性包含的内容的基础上,从基于可视化、基于局部近似、基于黑盒测试这三个方法层面对深度
燃烧过程中高温火焰的温度分布不仅能直接表征火焰的三维结构,还可以作为先验知识对燃烧过程的进行预判,具有深刻的指导意义。火焰层析成像技术以其易于实现和非侵入性等优点,在燃烧监测和诊断中发挥着重要作用。然而,由于传统迭代方法的数据量大、耗时较长。因此,本文建立了一种基于深度学习的火焰三维温度快速层析重建和预测的模型,训练后具有快速重建和预测的能力。建立并验证了基于视在光线法的辐射传输模型,建立了考虑辐
光作为一种承载目标信息的载体在很多方面都有很重要的应用,在日常生活中,错综复杂的环境会影响我们对目标信息的获取和判断。本课题对现有的多种从不规则散射光场中获取信息的技术进行分析及研究之后,为了解决现有的散射介质后目标分类方法适应性和鲁棒性差这一缺点,最终选择散斑自相关方法来处理散斑并获得隐藏在散射介质后的目标物体信息,为了解决传统特征提取和分类算法效率低这一问题,选择利用卷积神经网络对处理后的散斑
冲压发动机自发明以来被世界各国广泛运用到超声速领域,具有比冲高、结构简单,经济性高等优点。冲压发动机在世界各国的国防军事领域都有着举足轻重的地位,尤其是欧美等军事强国一直在致力于开展冲压发动机的技术研究。随着冲压发动机工作范围拓宽、飞行距离更远等需求发生改变,仅考虑燃油可调单一变量控制的冲压发动机已经无法适应新环境和新的作战需求。本文针对固定几何结构冲压发动机面临的问题,考虑引入进排气可调的结构,
同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)是机器人领域的重要研究问题,实现了机器人搭载相机和激光雷达等传感器在未知环境中对自身定位同时构建地图的任务。近年来,随着增强现实和自动驾驶等应用的兴起,视觉SLAM(Visual SLAM)研究受到了广泛的关注。VSLAM以图像作为主要感知信息源,通过多视图几何理论估计相机位姿和构建3D场景。
在医学诊断中计算机断层扫描技术(CT)是一种重要的技术手段,但是如果病人的身体中含有金属物质例如人造髋关节,脊柱植入物等,会导致扫描到的CT图像中产生明暗相间的金属伪影,掩盖人体器官组织,从而影响医生对于病情的判断。因此研究CT图像中的金属伪影去除算法具有重要的实际意义。因为传统去除金属伪影的算法在临床应用中效果并不好,要么计算时间较长,要么伪影去除不彻底。而近年来,在计算机视觉领域中,深度学习逐
随着信息技术水平的提升和现代工业的飞速发展,机械设备逐渐朝着集成化、电气化和自动化的发展方向迈进,其设备结构也越来越精细化和复杂化。机械旋转部件作为机械设备中的关键部件,一旦发生故障将会导致整个设备无法运转,轻则增加停机时间,重则引起大量经济损失甚至人员伤亡。因此,对其开展状态检测和故障诊断技术研究,可以维护机械设备的工业生产安全,具有重要的应用价值和潜在的经济效益。目前,机械旋转部件故障诊断工作