基于网页语义相似性的商品隐性评分算法

来源 :系统工程理论与实践 | 被引量 : 0次 | 上传用户:michael_lv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前电子商务推荐系统中存在客户评分稀疏性问题,隐性评分是解决该问题的有效方法,但现有方法只考虑客户对单个网页的兴趣度.客户浏览行为和网页之间语义相似度可以综合客观反映客户对商品隐性的评分.建立网页商品概念-属性矩阵CA(Goods Concept-Attribute Matrix),综合考虑商品属性、相关商品及其在网页中的分布等因素,基于客户浏览路径和时间的统计分析,通过语义词林WordNet计算网页语义相似度,综合计算商品语义隐性评分.通过算例和实证研究说明该算法的有效性. At present, the e-commerce recommendation system has the problem of customer scoring sparseness, implicit scoring is an effective way to solve the problem, but the existing method only considers the customer’s interest in a single web page. The semantic similarity between customer browsing behavior and web page can be integrated Objectively reflect the customer’s implicit score on the product.Create the concept of goods matrix-attribute matrix (CA), considering the attributes of goods, the related products and their distribution in the webpage, based on the customer’s browsing path and time Through the semantic word forest WordNet, the semantic similarity of the web pages is computed, and the semantic recessive score of the commodity is calculated synthetically.The effectiveness of this algorithm is illustrated by examples and empirical studies.
其他文献
现有的SVM主动反馈算法普遍受到小样本问题和不对称分布问题的制约.针对这些问题,文中提出一种基于偏袒性半监督集成的SVM主动反馈技术.该算法在集成学习框架中使用未标记数据以增加个体分类器之间的差异性,从而获得高效的集成分类模型.同时,高效的集成分类模型更有利于寻找富有信息样本,进而也提高主动反馈的效率.此外,文中还设计一种偏袒加权策略,使得集成分类模型对正样本给予更大的关注程度,以应对正负样本间的
将亮氨酸作为C末端氨基酸,采用片段缩合策略(2+7)合成亮丙瑞林.液相法合成困难序列Fmoc-Arg(Pbf)-Pro-NHEt时,以DIC为缩合试剂,THF作为溶剂,Pro-NHEt·HCl与Fmoc-Arg(Pbf)-OH
Much of the recent progress in understanding angiosperm phylogeny has been achieved using multi-gene or plastid genome datasets. However, it is largely unclear
Caytoniales are an important group of seed plants, and the nature of their female reproductive organ may influence interpretations of the seed plant phylogeny a
Worldwide construction and demolition waste (CDW) is currently dumped. To close the building cycle and the building materials cycle by recycling CDW in high tec
分数阶微分理论用于图像处理是近期一个新的研究课题.文中从分数阶微分对图像细微细节的增强能力出发,对分数阶微分的机理进行分析,且根据分数阶微分Tiansi算子的作用特点,提出一种可大幅增强边缘信息值的改进Tiansi算子方法.具体的做法是将Tiansi模板分解为8个不同方向的小模板,得到像素点周围8个方向的加权求和值.然后将8个值进行不同的分组,得到增强幅度不同的3种改进方法.最后通过增强的实验表明
Salvia L. (family Lamiaceae), a large genus of over 1000 species, is widely distributed throughout tropical and temperate regions of the world. Eight-four speci
XML数据包含丰富的语义信息,但现有的大多数XML搜索引擎并未利用这一信息.如何利用XML数据的语义信息提高检索质量已成为当前研究所关注的问题.设计并实现了一个基于语义相关
Deep Web中蕴含着大量高质量的数据,然而只有通过Web查询接口对Web数据库提交查询才能获取这些数据,因此,自动获取Web查询接口模式是实现Web数据库集成的关键.将Web查询接口