论文部分内容阅读
在互联网时代,电脑技术普及到千家万户,科技越来越以一种直观的形式展现在人们面前,悄然改变着人们生活、交流的方式。以讲故事为例,传统的讲故事作为家长、老师教育小孩的一种重要手段,仅仅通过口头的语言、书面的文字来实现;而今,故事可视化为讲故事提供了第三种途径:图片。在讲故事过程中,将故事可视化技术得到的图片作为辅助沟通手段,大大提高了沟通的效率。本文基于前人在故事可视化领域的工作,利用海量图片提取的特征,改进了故事可视化生成图片的效率和效果。本文的主要工作包括如下几个方面:首先,本文设计并实现了一套基于关键词语义信息的图片推荐算法。系统根据搜索关键词,从图片库获取图片,自动排序后提供给用户。本算法考虑了关键词包含的语义信息,依据图片主颜色、显著性、颜色聚集度等特征,同时兼顾关键词搜索结果的整体统计规律,给出一个图片推荐的结果。然后,本文总结了故事场景的常见布局,并实现了场景布局的自动推荐算法。此前,用户需要手动交互确定场景布局以及各个对象在场景中的位置;本算法参阅相关文献,结合故事场景的常见布局,利用数据挖掘中的分类技术,对关键词的场景布局进行标定,根据场景描述的特定关键词,自动推荐场景的布局方式。在自动场景布局的基础上,用户可以直接使用或者微调后直接使用故事可视化的结果。最后,本文设计并实现了基于分布式的海量图片特征数据库系统。系统提供了多线程的海量图片抓取工具,帮助用户在预处理阶段方便抓取十万张级别的图片数据;同时,系统基于分布式计算框架,高效地完成海量图片的特征提取;此外,系统还提供对海量图片特征信息的快速访问接口。