基于用户兴趣域的混合数据聚类标签算法

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:myf444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据聚类标签技术是在小规模样本上进行聚类,然后利用聚类结果对其余样本标注类别的方法是提高大规模数据聚类效率的一种有效途径.混合数据是现实应用中最广泛的数据类型,文章将用户兴趣数据作为小规模数据,利用K-prototypes算法对其聚类,在此基础上构建用户兴趣域.利用拟标签数据的各属性值与用户兴趣域分量的关系定义了数据关于用户兴趣域隶属度.基于用户兴趣域和"数据-用户兴趣域"隶属度的概念,提出了一种基于用户兴趣混合数据聚类标签算法UIMCL(User’s Interest Mixed Data Clustering Label).该算法克服了以往数据标签算法只能为拟标记数据指派一个类标签的局限性,可以应用于电子商务的推荐服务和用户行为分析.实验结果表明,该算法对混合数据聚类标签处理有较好的效果.
其他文献
子宫肌瘤是妇科最常见的良性肿瘤,约有1/5~1/4的育龄妇女患此病.肌瘤剜出术是只切除肌瘤而保留子宫的手术,能保留生育功能.我科自1995年1月至2001年6月在电视腹腔镜下对38例患
水文、水资源通讯规约通信规约中数据的准确传输得益于CRC校验,同时此校验也保证了数据传输的完整性。文章介绍了循环冗余校验(CRC)原理,并以实例阐述了它在水文、水资源项目
我科自1990~1996年共收治颌面部损伤住院病人120例,经临床治疗效果良好.现将其临床资料进行分析和讨论.
为深入贯彻习近平新时代中国特色社会主义思想和党的十九大精神,日前,国务院发布《关于建立企业职工基本养老保险基金中央调剂制度的通知》(国发[2018]18号)(以下简称《通知》),
除四害,讲卫生是爱国卫生运动的一个组成部分,也是两个文明建设的重要内容.四害传播的疾病,类型多,范围广,严重危害人民的身体健康.由蚊、蝇、蟑螂等病媒昆虫传播的各种疾病
近年来,我省艾滋病、性病的发病有逐年迅速蔓延和流行的趋势.截止2000年5月底,贵阳市共发现27例艾滋病病毒(HIV)感染者,其中3例已发病死亡.自1998年发现首例感染HIV的“坐台
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
常规免疫接种率报告是计划免疫的基础工作 ,完整、准确的接种率报告 ,对于掌握基层接种率变化情况 ,及时发现问题和调整免疫策略具有重要意义。贵阳市根据卫生部要求 ,从 199
为满足船舶港口大功率交流传动及电力推进系统的试验研究,研制了能量回馈式大功率传动试验系统。结合被试传动系统的特点,研究了负载模拟转矩控制模型。应用间接矢量控制方法