论文部分内容阅读
通用搜索引擎已经很难满足用户对电子商务信息的专业化需求,而提供专业化搜索服务的垂直搜索引擎并没有从根本上改变电子商务信息的查全率低、有效性低和同步率低的缺点。针对以上问题,通过研究通用搜索引擎的结构特征和信息搜集技术,详细阐述了通用搜索引擎技术的优缺点,并针对以上缺点,构建了基于Open API的垂直购物搜索引擎模型。经过试验证明,该系统可以有效解决通用搜索引擎的不足,满足用户的需求。 本文采用开放平台作为数据来源,并在此基础上提出了跨平台的数据搜集模块和异构数据标准化模块概念。数据搜集模块负责将用户查询翻译为不同开放平台的查询请求,利用开放平台提供的API接口,向各API服务器发送请求。数据标准化模块利用JDOM工具对服务器返回的XML数据流进行解析,提取产品相关信息,同时对异构数据进行标准化处理。异构信息通过标准化模块转换为系统定义标准格式,从而解决了跨平台数据异构的问题。该模型可以处理国内外跨平台的数据信息,实现跨数据源、异构数据信息的有效整合。与通用搜索引擎相比,使用Open API获取的信息由目标网站主动提供,减少了信息在收集和传递过程中产生的误差,可以满足互联网用户对信息时效性和有效性的需求。本文不仅在理论上阐述了使用开放平台构建跨平台搜索引擎模型的可能性,并且实现了基于Struts2框架的实验系统,利用该系统对理论的可行性和实用性进行了验证。实验结果表明本文提出的垂直购物搜索引擎模型在信息查全率、有效性和同步率上均高于通用搜索引擎所提供结果。