论文部分内容阅读
人类历史上,几乎所有的技术革命和思想变革都伴随媒介革命,信息的传递方式、管理方式和获取方式的不同决定了人们的生活习惯和思维方式,所以有关信息媒介的变革一定是底层的变革——互联网也是如此。互联网技术自发明以来已经走过了40多年,据统计,目前全球互联网用户总量已经达到全球人口的三分之一。随着互联网带宽和传输技术的发展,用户之间的交流已不再仅限于文本之间的信息流,多媒体(即图片、动画、视频)由于其涵盖的信息量大且便于人们理解,已经渐渐成为了互联网中最主要的信息载体。在这个历史趋势下,以图片为主的多媒体数据和信息如何利用和开发变成了一个非常热门的重要的课题。作为多媒体信息利用的第一个划时代的产品,图像搜索技术确实已经改变了人们的生活。随着时代的发展,信息检索已经变成用户的习惯,但用户的需求其实远远不停步于检索本身。如今的多媒体技术的发展已经呈现全球化、多元化、智能化三个趋势,并且更着重与从软件到硬件的整体结合。在这个背景下,增强现实技术成为了近年来学术研究和工业界广泛应用的技术。所谓增强现实,是指把原本在现实世界的一定时间空间范围内很难体验到的实体信息(视觉信息、声音、味道、触觉等),通过科学技术模拟仿真后再叠加到现实世界被人类感官所感知,从而达到超越现实的感官体验。总结之前的论述,多媒体特别是图像在互联网时代得到越来越多的应用和挖掘,面对整个星球的用户群和纷繁复杂的应用创意,其背后所需要的工程技术和算法将毫无疑问起到了决定性的作用。仅仅针对多媒体中的图像而言,大规模照片的存储和管理就需要云计算作为后台的数据计算平台,计算机视觉和图像处理就几乎牵涉了许多学科的成果和技术:机器学习、人工智能、数字图像处理、离散数学、数据结构等。提到图像处理与编辑中的经典算法,其中图论中的网络流算法占了很大的篇幅。图论算法在计算机科学中扮演着很重要的角色,它提供了对很多问题都有效的一种简单而系统的建模方式。很多问题都可以转化为图论问题,然后用图论的基本算法加以解决。基于以上提到的两点,本课题致力于将计算机视觉中网络流相关的算法应用在互联网景点图片的挖掘和增强中,从而极大的增强用户的视觉体验。无论是课题本身还是在实现课题所需要设计的算法都具有较大的创新和贡献。首先,这种基于互联网图片的景点现实增强是一个没有先驱工作涉及的问题。针对用户给定的景点照片,本课题设计的系统能够自动的获取其中的建筑主体,并且搜索相同景点的不同外观效果的建筑,并且完成自动的图像无缝嵌入,使得用户能够看到不同的建筑效果,其特点在于除了建筑主体发生变化之外,周围的场景和人物不会发生任何变化,这使得用户用一种很强的代入感。从课题本身的贡献来看,本研究工作主要的贡献点在于:课题的应用场景具有绝对的原创性,且能够够具有较好的用户体验,其算法框架可以扩展到其他应用场景。为了解决课题中的技术难点,我们设计并实现了一整套完整的建筑主体提取、相似建筑搜索、建筑自动替换的算法。创造性的应用并改进了图论中相关的重要算法和数据结构,将算法和计算机视觉与图像处理做了有机整合,在本课题的众多技术难点的解决中,将网络流这一组合数学工具发挥到了较高的水平,为今后网络流算法在图像处理中的进一步拓展应用做出贡献。