房地产交易信息搜索和匹配技术的研究与实现

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:chenpingaaa351
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,随着国民经济的快速发展,房地产市场交易日趋活跃。信息技术的快速发展,带动了房地产行业的信息化进程。房产门户网站在市场交易中的影响愈来愈深刻,如58同城,21世纪不动产,新浪乐居等,从房产门户网站获取房屋信息进行比较选择是愈来愈多购房者的首选。而对于政府部门来说,建立一个覆盖面广、信息准确的基础房产信息数据库有着重大意义,可以有效提高税收工作的效率,防止偷税漏税、阴阳合同等现象出现。本文通过对房地产信息特点的分析和互联网信息搜索与匹配技术的研究,实现了一个基于主题爬虫技术的房地产交易信息系统。首先,研究并提出了一种基于URL知识库的主题爬虫方案。该爬虫通过收集父网页内容、锚信息、URL内容计算得到目标网页与主题的相关度,在此基础上提取URL的特征并将其表示成一个带权重的向量来构建一个URL知识库,并对URL不断学习来动态更新URL知识库,以提高网页主题的匹配度。然后,研究并设计了基于遗传蚁群算法(GA-ACA)的信息搜索策略。GA-ACA算法主体过程运用遗传算法,利用遗传算法的随机性、快速性、全局收敛性,并结合蚁群算法的并行性、正反馈机制以及高效率的求解过程。一方面通过蚁群算法的信息素来指导遗传选择,另一方面遗传算法的选择结果引起信息素的更新,并用于指导下一次的遗传选择,使两种算法优势互补。最后,实验表明以上方法的应用在爬虫系统的查准率、查全率上较Shark-Search算法提高了5%,比Best-First-Search算法提高了20%左右。
其他文献
随着网络信息的爆炸式的增长,各种信息充斥着整个网络环境。人们现在已经习惯于去网络上搜寻一些解决问题的方法。当用户并不是十分熟悉一些搜索技巧的时候,他们往往需要花费很
物联网的快速发展,为现代社会提供了以万物互联为基础的巨大信息交互平台,是互联网时代信息获取和共享的更进一步的发展。而无线通信的高速发展,为物联网实现更大规模的信息
H.264视频编解码标准是由国际标准化组织ISO/IEC和国际电信联盟ITU-T联合制定的,又称为MEPG-4part10。与之前的标准相比,它的压缩比更高,网络亲和性更好,然而由于算法的复杂性,使
受物理极限和功耗散热等原因的限制,处理器工作频率的提升遇到了瓶颈。现在人们逐渐转向新的方式来进一步提高处理器的性能,比如在单个芯片上集成多个处理器核,于是同构和异构的
伴随着多媒体技术的快速发展与数码设备的广泛普及,在采集、存储、传递数字信息越来越便捷的今天,数字多媒体内容安全和数字出版物版权保护成为人们关注的焦点。数字水印技术
由于社会信息的日益复杂化,在许多领域,例如运筹学、管理科学、信息科学、工业工程、航天技术以及军事中都存在人为的或者客观的不确定性,表现形式也多种多样,如随机性、模糊
病虫害对植物的迫害已经成为一个严重的问题,尤其对于农作物来说,不仅会造成大面积的减产或绝收,而且会给某些经济产业带来一定程度的影响。因此,通过研究植物和病虫害间的相互作
动态场景下的视频监控,尤其人物或者交通工具的监控,是计算机视觉主要的研究方向,拥有广阔的应用前景。主要包括,特殊区域的监控,远距离人物识别,人流统计,和拥塞分析,异常行为检测以
近二十年来,机器翻译(machine translation,MT)研究迅猛发展。相比于传统的基于规则(rule-based)和基于实例(example-based)的机器翻译方法,统计机器翻译(statistical machine t
手机已经成为绝大多数人日常生活不可分割的一部分,它能提供给人们的服务数不胜数。手机流量数据的统计分析不仅能为手机用户提供更好的用户体验,也能为运营商做出更好的营销