基于卷积神经网络的教学视频文字识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:houjz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,“互联网+”时代到来。在教育领域中,一场基于互联网的技术变革正悄然发生,即大规模开放在线课程(MOOC)模式的出现。近几年来,越来越多的高等学府纷纷加入MOOC,不断开放MOOC课程,越来越多的学生通过MOOC课程学习,MOOC课程以视频为主,但是在进行学习过程中,往往需要重复学习视频中的内容,在查找视频中的内容时,往往只能手动慢慢去查找视频中需要的内容,极为不方便也很费时间。为此,一个能够从视频中通过内容检索找到相对应位置的方法对于解决上述问题显得很有必要。本文主要研究上述解决方法中的一个方面,课程视频中的文字识别,利用卷积神经网络(Convolutional Neural Network,CNN)对视频中的文字进行识别。具体研究主要包括:(1)对于课程教学视频中的文字定位,由于课程视频的特点,文字变化速度慢,对视频按帧检测文字会造成大量重复的检测,往往可能只需在成百上千幅包含文字的帧中检测一帧就可以检测出这些帧中的内容。怎么去找到这样的帧是面临的难点。鉴于此,本文考虑镜头检测的机制,通过设计一基于镜头边界检测的算法,从一序列连续帧中找到所需要检验的帧,称为关键帧,然后通过对关键帧利用边缘检测,形态学,投影法等图像处理方法定位出文字。(2)对于卷积神经网络训练数据集,手工构建一个中文数据集,其中包括用程序生成的多种不同字体的印刷体数据和来自CASIA-HWDB数据库的手写体数据,针对印刷体数据变化不够的情形,对它进行了随机增加噪声点,扭曲,模糊和打水印等数据集增强处理。(3)对于卷积神经网络的模型训练,分别从网络的结构设计,激活函数,损失函数,学习速率,参数初始化几个方面进行了研究,最终训练出一个鲁棒性强的卷积网络模型,用于对中文汉字(包括手写体和印刷体)进行识别。
其他文献
王维的诗或是对边塞沙碛壮丽奇景的描绘,或是对都市富丽堂皇气势的渲染,或是对苍茫壮阔汉江一带山川的刻划,体现了盛唐的富庶安定的社会图景及风调雨顺、民人熙乐的盛唐气象,即使
宋代以后出现了很多公私汇刻的丛帖,最早的当属《淳化阁帖》。《淳化阁帖》又名《淳化秘阁法帖》,是北宋淳化三年(九九二)太宗赵炅命翰林侍书王著等人以内府所藏历代墨迹为底
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
作为《巴黎协定》承诺的一部分,中国计划在2030年左右达到二氧化碳(CO2)排放峰值并争取尽早达峰。在研究如何实现上述减排承诺的前提下,中美研究人员组成的团队构建了一个自下
新古典现实主义作为现实主义阵营内部最为活跃的一支理论,在不断发展的同时也受到了不少批评。关于新古典现实主义的理论内涵、理论定位、发展方向也一直存在较大争议。本文
针对彭阳县实际情况,总结了其保护发展森林资源目标责任制工作的主要做法,分析存在的问题,并提出建设性建议,以期促进当地森林资源的可持续发展利用。
2020年《王牌对王牌》结束庆功会上,大家夸奖沈腾,说他已经超过周星驰了。沈腾赶紧说:“如果喜剧是一张考卷,我和周先生是考试的学生,成绩出来了,周先生考了100分,而我考了99分。你们认为100分和99分差多少啊?”  大家说:“能差多少,不就是1分嗎?”  沈腾摇了摇头说:“这不是1分,如果说在喜剧上我能得99分,那是因为我的极限就到99分,那已经是我的全部实力了。周先生得100分,那是因为试卷
空间环境模拟设备中采用多台GM制冷机组合式冷屏是一个新课题。介绍了GM制冷机组合式冷屏的设计、冷头浮动式安装结构、组合式支撑等,并对冷屏漏热作了详细计算。
我国住房公积金制度有待发展和改进,澳大利亚是住房金融发达和住房保障制度完善的国家,通过对澳大利亚住房制度的简要介绍,从贷款品种创新、支持中低收入人群购房、贷款的风
叙述了复杂结构的大型真空容器氦质谱检漏应用技术,分析了其中存在的问题。提出应设置合适的检漏系统、适当降低检漏速度及对复杂部位进行局部检漏等方法。