论文部分内容阅读
应用聚类技术能够自动地发现典型用户文件,但是由于会话向量通常是高维的稀疏向量,因此很难在会话向量之间设计有效的相似度度量.本文提出2种基于矩阵降维的典型用户文件发现方法.这些方法应用非负矩阵分解技术降低会话-URL矩阵的维数,并通过球形的k-均值算法对用户会话向量的投影向量聚类,由此得到典型用户文件.实验结果表明,这些算法能够有效地从用户会话中发现典型的用户文件.