溯洄从之,一波三折

来源 :中国信息技术教育 | 被引量 : 0次 | 上传用户:wangya110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  蒹葭苍苍,白露为霜。所谓伊人,在水一方。
  笔者何以突发雅兴,大家且看下面发生在实际教学中的需求。
  在人工智能的图像或声音识别任务中,常会遇见卷积运算的环节。所谓卷积运算,是将特定的卷积核与卷积区域进行点乘然后取和,从计算过程上看并不复杂,而不同卷积核对图像特征提取的效果,也可以很直观地展现出来,网络上很容易找到大量的卷积运算及特征提取的实际案例,也可以下载卷积运算的代码,手动更改卷积核,并观察特征提取的效果。
  例如,在GitHub上可以找到名为“python-conv2d”的代码,下载后就能轻松定制卷积核提取图像特征,图1和图2所展示的就是对图片进行边缘提取前后的画面,而图3则是用来进行边缘提取的卷积核。
  卷积核的点乘计算过程简单,相关资料很容易找到,本文不做展开,然而,教学中可能遇到的一个大问题,是解释“何以各种卷积核能达到特定的特征提取的效果”。这个问题并不容易回答,因为在解释过程中,必然要回溯到滤波器的概念,进而再回溯到与信号处理相关的若干数学概念。这便让笔者想起《蒹葭》中的诗句来:
  溯洄从之,道阻且长。溯游从之,宛在水中央。
  尽管道阻且长,但抱着不惧波折、追根究底的精神,尽可能亲自回溯源头,哪怕是远观佳人绰约风姿,总好过道听途说、人云亦云。本文将要介绍的几个小实验,或可成为溯源之舟。
  ● 简单的叠加,不简单的分离
  为了能够更简单地展现出特征提取的原理,就要先创造出尽可能简单的数据。相较于数据量庞大的图像和声音,可以试着创建一系列项目数有限又能展现出波的图样的数据,将数据放置在一维的存储空间中,利用数据的变化,来解释特征提取的意义与方法。这里使用电子表格这种简单且直观的工具,创建两个频率不同的正弦波,然后再将两个波进行叠加。
  ①使用拖拽功能,在电子表格的第一行生成一个差值为10的等差数列,数列项可以略多一些,如从0、10、20、3一直到720,此数据用以反映正弦波在横轴上角度的变化。
  ②使用公式“=A1*3.14159/180”,
  在第二行拖拽生成对应第一行角度值的弧度值。
  ③使用公式“=2*SIN(A2)”,在第三行拖拽生成正弦波Y=2*SIN(X)的函数的值,为叙述方便,称为正弦波A。以上过程的部分数据和波形图如图4、图5所示。
  ④使用与上面类似的方法,生成正弦波B的数据和图像,正弦波B的角度数据项差值为60,函数为Y=SIN(X),也就是说,生成的正弦波B的频率是正弦波A的6倍,振幅是正弦波A的一半。由于角度数值的差值比较大,所以这个正弦波看上去不太平滑,但不影響后续操作。部分数据和波形图如图6、图7所示。
  ⑤使用拖拽功能对两个正弦波相加,得到如图8所示的部分数据和如图9所示的波形,称为波C,当然,这不再是一个正弦波。
  接下来的任务,当然就是假装不知道波C是如何产生的,而要想办法对波C进行某种操作,使得波C中不同频率的波形(特征)能重新显现出来。可以发现,虽然两个波的叠加产生新的波形很容易,但若要将一个叠加而成的波分离开来,却麻烦多了。例如,为了让高频率的波形(即正弦波B)重新呈现出来,就要过滤掉低频率的波,反之亦然。可以很容易看出,所谓特征提取,其实与滤波有关。因篇幅有限,本文只围绕高频信号的提取,讨论相关教学策略。
  ● 简单的假设,不简单的过程
  想一想,为了实现高频信号提取的任务,可以采用哪些方法?教学中,不妨鼓励学习者展开一番头脑风暴。
  一个容易想到的解决思路是:既然当前波C是两个波的叠加,那么,只要将当前的波C减去一个低频的平滑的波形,就可以获得高频的波B的图样了。从直观上看,这个低频的波的形态大致如下页图10中的虚线所示。
  虽说大家心知肚明,这个低频波的图样应当和Y=2*SIN(X)函数图像有关,但这里却只能继续玩假装不知道的游戏,因为要设法让计算机自己找到能契合图样的数据,而计算机当前可以利用的,就只有波C的数据。
  开展头脑风暴所获得的解决方案可能有:对邻近连续的几个数据取平均值,或许能获得一个低频的平滑的波X;不停地执行将“波峰”削除、“波谷”填满的操作,或许能获得一个低频的平滑的波X;找出当前波的局部最大值和局部最小值,取局部最大值和局部最小值的平均值,利用这些平均值或许可以描画出一个低频的平滑的波X……然后,将波C减去这个新生成的低频的波X,观察能否提取出高频的信号。
  第一个方案实现起来比较简单,但较难获得平滑的低频波形。下页图11分别是通过用邻近5个数据取平均值获得的低频波,以及用波形数据相减提取出来的高频波,提取后,高频的波形形态较好,但仍然有一定量的低频信号混杂其中(宏观起伏仍较明显),总体效果尚可。
  第二个方案中,为了削峰填谷,对每三个数据,取左侧和右侧的数据计算平均值,对获得的新的数据再反复进行迭代操作获得低频波。图12是进行四次削峰填谷的迭代操作后,获得的低频波和提取出来的高频波。效果看上去不错。
  第三个方案中,可以在电子表格中使用IF函数,通过比较大小获得局部最大值和局部最小值,然而麻烦之处是,每两个局部最大,或者每两个局部最小的数据,它们中间的数据应该如何填充?如果按电子表格中容易实现的方法,按邻近的局部最大值或局部最小值填充进去,获得的波就不可能是平滑的。操作结果如图13所示,特征提取的效果十分勉强。
  若是要改进方案三,使得低频信号变平滑,就要借助如插值、函数拟合之类的方法。在电子表格中实现是比较麻烦的。
  在教学中,为了培养学习者自主思考和探索的精神,教师应鼓励学习者大胆给出可能的解决方案,并尽力尝试用当前已有的工具,验证在具体的解答过程中,哪些方案更具有可行性,而不是直接将解决方案抛给学习者。   ● 简单的表象,不简单的幕后
  在学习者充分思考了各种假设,并加以实施验证之后,教师最后抛出更优的方案,才更能促人思考。前文中提到可用取均值的方法来获得低频平滑的波,但正如图11所示,生成的低频波的图样一波三折,不是特别理想。不过,虽有不尽如人意之处,却能成为进一步研究的线索。
  之所以采用取均值的方法难以使波形平滑,从直观上看,是因为局部的波峰波谷过于突出,若是在取均值时,能降低突出部分的权重,加强非突出部分的权重,或许能使生成的低频波形的平滑度有所提高。
  例如,对于波形中的5个数据,按“=A1*0.25 B1*0.2 C1*0.1 D1*
  0.2 E1*0.25”公式获得C2表格中的数据(如下表)。
  若当前采样点处于局部波峰或局部波谷处,则公式的作用显而易见。但如果当前采样点不巧正在局部波峰和局部波谷的中间处,会不会反而将波峰和波谷处数据放大?对照波形图样计算一下就会知道,由于高频信号的周期性变化,按每5个数据取值,就算波峰和波谷数据同时被放大,在相加后,波峰处被放大的数据也会和波谷处被放大的數据相抵消。
  于是,可以用拖拽的方法,每5个数据生成一个加权平均值,并按生成的一系列加权平均值生成波形,该波形图样看上去相当平滑了(如上页图14)。用此波形,对波C做减法后,得到的高频波的图样也相当不错(如图15)。
  到了这一步,大家有没有想到,既然可以用取加权平均的方法获得低频的波形,那么,能否用同样的方法,直接把高频的波形提取出来?试一下就知道果然可以。例如,设“=A1*(-1) B1*2 C1*(-1)”这样的公式,其思路是,将当前位置的数据权重加强,同时将当前位置两侧的数据权重减少。虽然说方法十分简单,但实施效果之出众,简直令人叹为观止。部分数据及波形图如图16所示。
  仔细观察就会发现,这个所谓的加权平均法,其实就是如假包换的卷积运算。这样一来,就只剩下一个问题:加权平均法中的“权”的取值,究竟应该怎么取才最为合理?这个地方,就立下了一个未来通往“傅里叶解析”这门课程的路标了。但对于大部分基础教育阶段的学习者来说,在人工智能的学习中,他们能够看到路标的存在并理解路标指向路径的意义,就算是完成学习任务了。在实际的特征提取任务中,通过反复试错,或者团队暴力搜索,再加上一点推理和空间想象力,要为加权平均法找出一套合理的权重值,并不困难,在课堂上,完全可以利用充足的人力,开展一项寻找合理权重值的挑战游戏。
其他文献
今年秋天,我在纽约小住。一个清新的早晨,我和朋友从西72号大街的地铁车站开始漫步,越过中央公园時,公园的小路上传出优美的爵士音乐。循着音乐声,我们发现原来是4个打扮时尚的美国大学生,正在用心演奏,看得出他们都非常投入。驻足聆听的人越来越多。   但显然不是每个人都喜欢这样的音乐。一位围观的老人开始大叫大嚷,大学生们试图“忽略”这位老人的干扰,继续忘情地为他们的众多“粉丝”演奏。但情绪激动的老人丝毫
46  城市的车流是农村的河流多好  农村的河流是城市的车流多好  城市和农村看星星一样明亮多好  47  无聊说:下雪了,雪真大  无奈说:雪真大,还在下  诗人说:雪是诗,雪是画  48  眷恋森林的不该只是鸟  热爱大海的不能只是鱼  人类呵,觉醒经常在反省后  49  栽树的人,梦中也是浓郁的绿阴  养花的人,脚下自有飘香的芳径  袖手的人,只能叹着气望梅止渴  50  只有行走在雨雪中 
读历史的时候,偶然读到清末名将张曜一个有趣故事。张曜自幼失学,因屡立战功而被任命为“河南布政使”,不想一位姓刘的御史弹劾他“目不识丁”,布政使是一省的高级文官,相当于现在负责公检法的副省长,哪能让没有文化的人担任呢?所以,朝廷将他改任为总兵。在那个时代,由武改文是极大的荣耀,而由文改武则是一种耻辱。受此刺激,张曜开始发奋读书,并且特意刻了一枚“目不识丁”的印章,随身佩带以自警。几年之后,张曜因文化
人脉对于职场中的许多人来说,其重要性是不言而喻的。然而由于繁忙的工作、生活压力的负荷,对于人脉的经营便会疏淡下来。地么如何能呵护好自己的职场人脉呢?  用细节打动对方  30岁的张强,如今已是苏州某旅行社的总经理助理。几年前,他还是另外一家旅行社的小职员。自己之所以升迁这么快完全是人脉起了巨大作用。  2004年,福建人张强来到苏州闯荡,应聘进入一家旅行社工作。那时候他刚刚离开大学校门,在苏州又举
欧康诺的“小华盛顿旅馆”,被称为“天堂名列第二”的旅馆。老板欧康诺认为:“在服务业,要让顾客感受到快乐,这是成功的关键。”所以他们一切工作都是围绕着让顾客高兴做文章,下工夫。  首先旅馆的装潢就以为顾客创造惊喜为目标。虽然它身处乡村,但却不输给大城市的高级饭店。这个屋龄100多年的两层楼建筑,由曾经为英国王室进行室内装潢的伦敦知名设计师掌舵,室内处处可见19世纪的古董。而在天花板上还珍藏了1.5万
STEM课程在学校的全面推广,使得一大批项目或主题也随之涌现,但大部分项目都只停留在学习技术或锻炼能力的浅层次上。那么,如何让这样的项目变得更加有意义呢?A-STEM的做法是从人文精神的角度出发,赋予这些项目人文价值,从而激起学生内在的社会责任感和底层价值观,促使学生主动从日常生活中或教师预设的课程中生发新的问题、新的项目,主动探究,主动创新,最终实现为人类福祉服务的美好愿望。  ● 项目缘起  
我的父亲一直住在老家的那座老屋里,老屋的墙壁洋溢着沧桑的气息,经历了宁静而平淡的时光流逝,老屋已经有些陈旧和斑驳了。朴实的墙壁围拢成一个屋子,我的父亲就在里面和母亲生活了一辈子。  父亲喜欢看报纸,尤其喜欢看那些天下大事和古老的趣闻轶事。母亲忙完了烦琐的家务之后,就会坐在父亲身边,絮叨一些不知重复了多少遍的话语。每次母亲絮叨的时候,父亲叫是低着头,一边看报纸,一边漫不经心地应答着。  时光就这样一
人物导读:王永辉,河北省唐山市丰南区大齐各庄镇大长春村村主任。2014年,王永辉通过考察学习从山东引进新品种,发展棚室桃种植,并创建雪丰果蔬种植专业合作社,现拥有社员125人。从棚室高标准建设、种植新技术应用,到绿色认证品牌创建,在王永辉及合作社带动下,本村及周边乡镇村民走上了致富路。  在河北省唐山市丰南区大齐各庄镇大长春村260亩的土地上,座落着42个棚室,全部种植各类鲜桃,这在全市也是首屈一
当前国家各个方面正在形成合力,重点帮助支持贫困地区和民族地区发展,最重大的机遇是脱贫攻坚和农业供给侧结构性改革。作为国家集中连片特困地区武陵山片区的核心区、湖北省扶贫攻坚主战场,恩施州迎来了赶超跨越的重要战略机遇期、绿色崛起的窗口期、全面小康的攻坚期。按照新发展理念,做好富硒和全域绿色生态文章,把生态优势转化为经济优势,把发展劣势转化为后发优势,打赢扶贫攻坚战是我们的首要任务。  良好的生态环境是
四季听雨  我常常在凌晨的雨声中醒来,凝视窗外的微亮,不时有飞影掠过。我在雨声密布中分辨每家每户雨檐的高低与大小,甚至质地如何。静静地听雨,是人生的享受,可在夜晚,可在白昼;可在室内,亦可在户外。特别是荷旁听雨,别有一番滋味,无论绿荷,还是残荷。不仅听四季的雨声,还听雨的颜色、粗细、速度等性状。不同的季节有不同的雨声,不同的雨声蕴含着不同的境地。坐着和躺着听雨有着不同的享受,在家里和在异乡听雨更有