Web文本挖掘的研究

来源 :兰州理工大学 | 被引量 : 13次 | 上传用户：ck2112

【摘要】

：

信息技术的发展使Internet出现了“信息丰富而知识相对匮乏”的问题。由于Internet的开放性及异构性,用户很难快速准确地从WWW上获取所需信息,因此,如何快速有效地提取所需信

【作者】

：

王娜

【机构】

：

兰州理工大学

【出处】

：

兰州理工大学

【发表日期】

：

2005年01期

【关键词】

：

数据挖掘 Web文本挖掘信息检索文本检索概念格

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

信息技术的发展使Internet出现了“信息丰富而知识相对匮乏”的问题。由于Internet的开放性及异构性,用户很难快速准确地从WWW上获取所需信息,因此,如何快速有效地提取所需信息是一项重要的研究课题。Web文本挖掘作为一种有效的信息检索技术,在近几年倍受研究者的关注。本文以此为研究重点,主要做了以下工作: (1) 探讨了Web文本挖掘的意义,系统地给出了Web挖掘的定义,对Web挖掘的任务进行了分类,讨论了Web挖掘与传统的数据挖掘、Web信息检索之间的关系。 (2) 系统阐述了Web文本挖掘的工作流程,重点研究了Web文本挖掘的特征表示、文本分类、聚类等相关技术,介绍了文本挖掘的研究课题及应用领域。此外,对Web文本挖掘系统WebMiner进行了系统介绍。 (3) 介绍了概念格的基本理论,探讨并研究了概念格理论在数据处理与分析方面的优势。深入分析了当前搜索系统存在的缺点,在Web文本检索中运用概念格理论挖掘文本中潜在的概念结构及概念间的相互关系,提出了一种基于概念格理论的Web文本检索方法。

其他文献

扩频技术在低截获概率雷达上的应用研究

现代电子支援侦察(ESM)接收机和雷达告警接收机(RWR)尤其是反辐射导弹(ARM)的应用对雷达的生存构成了严重的威胁,低截获概率雷达正是在这种环境下提出的一种新体制雷达,它试

学位

低截获概率扩频多普勒预处理二维傅立叶变换

非等周期ZCZ序列偶信号设计

在准同步CDMA通信系统中,对所采用扩频地址码的要求是在同步误差范围内(零时延附近)具有理想的相关特性,零相关区域(ZCZ)序列就是能够满足这样要求的序列。本文在总结和比较

学位

准同步CDMA系统序列偶非等周期ZCZ序列偶序列偶集合互补序列偶

无线有线融合光网络中的微波光子信号产生技术

随着各种新兴通信业务的出现，终端用户的带宽需求不断提升，人们对网络系统带宽的需求持续增加。由于无线通讯的带宽需求持续增大，传统的电子技术已经无法满足传输速率提升的需求

学位

无源光网络正交频分复用分层调制物理层加密微波光子信号

基于Petri网的工作流管理系统的研究与设计

近年来,随着信息技术的蓬勃发展,尤其是网络通讯技术、多媒体技术、数据库技术的发展,为企业和单位的电子公文流转提供了更为广阔的发展空间。在涉及到如何处理文档信息、如

学位

工作流Petri工作流建模公文流转Lotus Domino/Notes

基于Linux的方向感应加密系统及汽车导航系统的研究和实现

当前,各种功能的嵌入式设备以其使用简便、面向特定应用、便于携带、微功耗、低成本等普通设备无法比拟的优势为亿万用户所接受。本论文涉及的方向感应加密系统和汽车导航系

学位

嵌入式Linux操作系统加密系统导航系统SitsangQt

Web文本挖掘的研究

其他学术论文