个性化的互联网信息获取技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:jn116600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,互联网(Internet)在今天已经渗透到人们的日常生活、娱乐、工作和学习等各个方面,越来越多的人在互联网上发布和获取信息.为了有效地检索和利用互联网上的信息,人们研究开发了包括搜索引擎在内的多种信息获取技术,以Google为代表的通用搜索引擎已经成为今天人们在Web上检索信息的主要方式.这类基于关键词检索的搜索引擎在一定程度上满足了互联网用户的信息需求,但是在信息的覆盖率和精确度上还不能满足用户的实际需要.互联网上的信息搜索、抽取问题是互联网迅速发展与普及的过程中一个急待解决的问题,引起了国内外研究人员的广泛兴趣.互联网的无限空间对于用户如何更方便地获取自己真正想要的内容带来了很大困扰.用户迫切需要一种能够根据用户的特点自动组织和调整信息的服务模式,帮助用户得到适应性的信息和服务,即个性化的互联网信息获取服务.该论文包含四个部分内容.第一部分介绍了互联网信息获取技术和个性化技术的总体情况、国内外的研究和应用现状,以及与此相关的重要理论及技术.第二部分综合了多种人工智能的理论和方法,包括半结构化模型理论、启发式搜索方法、机器学习以及信息的智能抽取技术等,对互联网信息抽取问题进行了深入的研究,并提出了一种新的方法.第三部分则在前面研究的基础上,探讨了个性化在互联网信息获取方面的应用,详细介绍了我们研制的两个个性化的互联网信息获取系统:互联网中文信息智能采掘工具和个性化Web主题信息监控系统.第四部分对该论文的工作进行了总结,并提出了进一步研究的方向.该论文主要的工作特色有以下三个方面:1)该文在相关研究成果之上,提出了一种基于路径树学习的信息抽取技术,该技术结合了归纳学习、网页结构分析等多种技术的特点,可以基本满足一定的互联网信息抽取的要求.2)该文提出了一种基于关键词加权重的用户建模技术,能够快速、准确、有效地获取用户的短期和长期的兴趣信息.采用该技术建立的用户模型准确性高、实现简便、易于维护.3)该文介绍了我们研制的两个个性化的互联网信息获取系统:互联网中文信息智能采掘工具和个性化Web主题信息监控系统.互联网中文信息智能采掘工具综合使用了元搜索、用户兴趣建模以及自动文摘等多种技术为用户提供个性化的服务.个性化Web主题信息监控系统则是一个集成了用户建模技术、Spider技术、主题鉴别技术以及全文索引等技术的综合系统.
其他文献
在国家863项目"建设合肥网格节点及开发若干典型应用"的支持下,中国科学技术大学国家高性能计算中心、网络中心和科大生命学院分子计算实验室合作开发这个基于网格计算环境的
信息安全已成为社会各个领域迫切需要解决的重要问题,利用中国白主研发的电子密钥(硬件/软件)系统是中国需要尽快解决的紧迫任务.该论文结合国家863项目"高安全低能耗专用微
计算机可视化技术为我们提供了直观、有效、准确的医学分析手段,基于医学影像的器官三维模型重建就是其中十分重要的一个方面,它在外科手术计划、医学研究与教学、远程诊断分析
在模式识别和计算机视觉领域中,特征提取一直是难点之一,传统的基于特征的识别方法都预先定义一种特征,再依据定义的特征进行分类识别。深度学习作为传统机器学习的发展,因其基于
随着Internet的飞速发展,网上应用的种类和重要性日益增加,计算机系统的安全变得越来越重要,也越来越具有挑战性。现在的各种静态安全技术,如防火墙、数据加密等都比较成熟了,但是
为了窄带数据传输设计的TCP/IP仍然是目前互联网所使用的主流网络体系结构,但是随着各种新型网络应用的涌现,它的弊端则越来越明显地影响应用业务的发展。从20世纪90年代开始,在
在Internet蓬勃发展的今天,网络计算正在成为资源整合、协同工作的主流方式。在这种背景下,传统的访问数据库利用数据资源的方式已经不能够很好地满足新的需求。本文结合Inte
随着医学成像设备和计算机软硬件的发展,医学断层切片图像的三维重建与显示已越来越受到重视并逐渐应用于临床.该文设计与实现了一套功能完整的三维重建软件My3d.该软件采用
中科大网络中心移动IPv6研究小组承担了中科院研究生创新项目—"基于移动IPv6的VoIP技术研究",该文作者承担了其中VoIPv6软件移植和QoS保证的研究工作.该文根据作者在这些方
在应用中,与在线产品标识自动识别系统相类似的实例很多,对该系统的设计与开发的研究,具有较好的参考价值。本文针对在线产品标识自动识别系统的特点,对设计该系统中遇到的关键问