论文部分内容阅读
随着移动互联网的快速发展和大数据时代的到来,越来越多的网站提供了图片服务。热点人物一直都是人们关注的对象,网民也喜欢从网络中搜索热点人物的图片进行欣赏。但是在网络上搜索人物图片的时候,仍然存在着一些问题。一、搜索引擎主要以关键词或者图片ID的方式搜索图片,搜索结果中存在着大量与用户搜索目标无关的数据;二、搜索的结果是以图片列表形式展现的,能获取的信息常常只有图片以及一段关于图片的简短描述,这在一定程度上造成了信息的缺失;三、搜索图片的时候,尚未有有效的推荐机制去推荐关联的图片给用户,或者系统推荐的图片的关联度不高。这三大问题增加了用户搜索人物图片的成本。 自万维网之父在1998年提出语义网的思想以来,学术界和工业界掀起了研究语义网的热潮。语义网的目标是构建一个全球化的网络,计算机能够理解网络上的数据和数据间语义关联关系,能够自动的进行语义判断,实现人与电脑之间的无障碍沟通。经过十多年的发展,语义网的理论和技术日趋成熟。 针对上述提到的问题,考虑到语义网具有表达知识能力的优势,本文设计并实现了一个基于本体的人物图片检索系统模型。论文先通过基于关键词搜索的方式从网络中抽取人物信息。基于网页共现和句子共现的方法,从新闻语料中挖掘人物的关联关系。采用OWL语言描述关于人物图片的领域本体知识库,使用Jena来创建本体知识库。接着使用Stanford Parser解析用户输入的查询语句获取依存关系树。通过句法分析、语义解释转换成SPARQL语句,通过查询引擎执行SPARQL并返回结果。最后总结了论文所做的工作,并对未来的工作做出展望。