基于用户浏览内容的Web用户浏览行为个性化研究

被引量 : 0次 | 上传用户:hezefgj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网与WWW以惊人的速度迅猛发展,使得设计与维护Web站点的工作变得尤为重要。摆在研究人员面前的新课题是如何管理WWW上的大量信息,以满足用户不断增长的个性化的信息需求。个性化服务技术已经成为当前信息服务领域的研究热点之一。所谓个性化服务就是指对不同的用户采取不同的服务策略,提供不同的服务内容,其关键在于必须知道用户的兴趣,并准确地建立用户兴趣模型。本文首先对数据挖掘技术进行了阐述,进而分析了当前主要的Web挖掘技术和用户兴趣建模技术,提出了以Web用户浏览内容分析为主和以浏览行为分析为辅的用户兴趣挖掘过程模型。然后,初步研究和探讨了对文本页面的表示技术,包括:文本的向量空间模型表示、特征项的选择和抽取算法,将文本页面表示为结构化的向量空间模型格式。接着,本文重点探讨了文本页面的聚类分析和用户兴趣模型的建立两个方面。通过文本之间的相似度计算,对文本集进行聚类分析。在比较了现有聚类算法和实际应用环境后,提出了将层次凝聚法(agglomerative algorithm)和平面划分法(K-means algorithm)相结合的新算法。在聚类结果的基础上,采用二层树状用户兴趣模型以加权矢量格式来表示每一个用户的兴趣。为了便于用户兴趣模型的使用和更新,每一兴趣类也采用向量空间模型来表示,内容页面与兴趣类的比较就可以采用常用的相似性函数来进行相似度计算。最后进行了模拟试验,使理论直观化了,具体化了。通过试验也表明了本文所改进的聚类算法实现简单,准确率较高;提出的用户兴趣模型能较准确地描述用户兴趣所在,在个性化推荐服务中具有实际应用价值。
其他文献
本文随机选取了10个皮鞋样品,使用国外防滑测试标准对其进行动态防滑测试,研究发现大部分鞋底湿态动态摩擦系数不能满足国外标准基本要求,存在严重的安全隐患,国内关于鞋底防
1概述1972年Strong和Jako首次对经口激光显微手术(TLM)在治疗声门癌中的应用进行了报道。自20世纪90年代初,TLM的适应证已经扩大到包含上呼吸消化道的所有肿瘤类别。现在,TLM
本文就位于软基基础上的水闸工程混凝土的裂缝问题进行了详细的研究,总结了裂缝的形式,分析了裂缝的形成原因,对控制裂缝的工程措施进行了深入的研究,运用数学模型对各种工程
在知识经济时代,企业之间的竞争更趋激烈。时代的剧烈变化深刻地影响着企业的方方面面,人力资源管理也在因此而发生深刻的变化。从战略层面为企业的持续发展提供支持,成为企
21世纪中叶我国将处于全面实现现代化和走向全球化时期,在此期间我国将面临人口老龄化、劳动力不足和资源短缺。这一时期是人与资源矛盾最尖锐时期,也是环境治理最艰难时期。
文章客观剖析传统课堂教学模式现状的同时,从教师教学功能、学生主体地位、学科知识设计三大层面入手探讨了'互联网+'大数据背景下教育变化,结合知识网络化传递、教
三七为五加科植物三七Panax notoginseng(Burk.)F.H.Chen的干燥根,是著名的传统中药,具有止血、散瘀、消肿、止痛等功效。现代化学和药理学研究表明三七中皂苷类成分在免疫系统
本文在总结以往文献的基础上,对重要的医药、农药和染料中间体氨基吡啶类化合物,尤其是2-氨基吡啶及其衍生物、3-氨基吡啶、4-氨基吡啶的合成进行了研究。分别以2-氰基吡啶、
本论文主要研究我国水果供求关系及变化规律,从复杂的水果供求关系系统中抽象出影响水果供求关系的主要因素,分析这些因素间的相互作用的内在机制,对正确决策水果产业发展战
本文通过对区域和区域经济概念的研究,构建了区域经济发展水平的评价指标体系,并利用以区间特征根法为单排序方法的区间判断层次分析法对江苏省13个省辖市的经济发展水平进行了