移动图书馆用户评论自动聚类研究

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:ffanhaixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网环境下,移动图书馆服务开始兴起。移动图书馆用户评论的研究基本处于初期的摸索阶段。关于移动图书馆用户评论的研究尚不成熟,忽略了移动图书馆用户评论自身的特点,缺乏适合移动图书馆用户评论的处理工具。因此,为了获取用户对移动图书馆服务平台的评价,本文对移动图书馆用户评论,进行特征分析,通过文本处理的方式,了解用户的需求,尤其是用户的隐性需求,进而为移动图书馆相关人员进行进一步研究提供数据支撑,为用户提供更优质的服务。笔者通过文献调研,了解移动图书馆用户需求研究现状、用户评论数据研究情况和文本处理相关技术;通过与超星公司合作,获取到移动图书馆用户评论数据(主观题嵌入到问卷调查+移动图书馆后台服务器数据);从用户移动图书馆用户评论出发,结合文本信息处理的流程,全面分析评论特征,包括评论的基本特征和差异性特征,在此基础上构建移动图书馆词典,基于评论语料、CNKI语料、现有词库借鉴与扩展等多渠道收集词条,最终形成包含43826个词条的移动图书馆词典。利用移动图书馆词典对用户评论进行分词,对移动图书馆用户评论进行聚类研究,结合移动图书馆用户评论的特征,对聚类算法适当改进以适应移动图书馆用户评论的场景,并测评移动图书馆词典对聚类结果的影响。基于以上研究内容,搭建移动图书馆用户评论自动聚类系统,以期为后续评论处理提供简易的工具。本研究发现,在以移动图书馆用户评论部分数据实验为测试集中的测评结果显示,本研究所设计的聚类效果更好,聚类的准确性、稳定性、F值等评价指标明显优于传统K均值算法,验证了算法改进的有效性、合理性。在移动图书馆用户评论测试语料中,使用移动图书馆词典进行聚类的结果的F值明显高于使用结巴自带词典的聚类结果,移动图书馆词典聚类效果明显优于结巴自带词典聚类效果,且移动图书馆词典聚类的稳定性明显优于结巴自带词典聚类。用户评论自动聚类系统(包括数据导入模块、预处理模块、数据分析模块、聚类结果展示模块和查询模块)应用到移动图书馆中,快速有效获取到用户需求,验证了方法的有效性。根据聚类结果进行初步分析,本文认为:移动图书馆服务平台应注重资源质量与数量,细化并拓展平台的外延服务,增加更多的实用功能。简化用户操作,提供合理友好的容错机制和安全隐私保密政策,提升系统技术质量。激励用户参与,支持线上线下交流,提供个性化的定制服务。平台设计者、开发者们应充分利用技术,比如说利用图层压缩技术缩小app所占的内存空间,减少流量等资费支出,降低用户的使用成本;考虑到电子屏幕对用户视力的影响,不妨借鉴其他软件,比如Word护眼模式等,关爱读者视力健康。
其他文献
鄂尔多斯盆地吴起地区长6储层油气资源丰富,多年来勘探开发实践表明其特低-超低渗透储层比较发育,储层内部的微观孔喉结构特征直接制约影响着储层的品质和其采收程度,因此厘
可食性资源多糖是从可食用性材料中提取的安全无毒的天然多糖,具有多种药理活性,国内外报道可食性资源多糖具有免疫增强、抗氧化、降血糖、降血脂等多种功效。因此,本文选用4
人脸检测技术是计算机视觉领域的重要研究方向,是人脸识别、人脸关键点检测、表情识别等技术的关键步骤,具有广泛的研究前景。但在现实情况中,由于复杂的拍摄环境,人脸检测技
池塘养殖是我国水产养殖的重要支柱产业,养殖总产量逐年上升,这与水产养殖业逐步实现机械化,采用水体增氧技术密不可分。给水体增氧能提高池塘养殖的放养密度,增加养殖对象的
近年来,杂交鳢已经成为鳢科鱼类养殖产业中最重要的水产品种,其规模和养殖密度不断增长,而高密度集约化养殖导致了杂交鳢养殖环境严重恶化以及病害频发等问题,极大地阻碍了杂
硫酸根自由基(SO4·-)高级氧化技术是一种新兴的环境治理技术,它通过过硫酸盐的活化产生强氧化性的SO4·-,能够高效地降解废水中的难降解有机污染物。在众多过硫酸盐活化方式
如今,纳米材料在生活、工农业生产中都得到了广泛的应用,不可避免的会排放到水环境中,从而对水生生物造成一定的影响,而重金属镉(Cd)对水生生物的危害已引起广泛关注,那么二者
由葡萄糖单元通过α-1,4-糖苷键首尾相连形成的天然环寡糖环糊精是重要的主体分子,但因其外亲水、内疏水的较为刚性的结构、数量有限的腔体尺寸和单一的重复单元等特性,不能
本论文以吉富罗非鱼(GIFT,Oreochromis niloticus)为研究对象,通过室内循环水饲养和亚硝酸盐应激试验,研究了饲料中添加桑叶黄酮(Mulberry Leaf Flavonoids)对吉富罗非鱼生长
叠前道集存在剩余噪音,分辨率低的情况,需要对叠前道集进行优化处理。针对处理方法中的不保幅现象做出改进,做到高保真性的叠前道集优化处理,并尝试将二维处理推广至三维空间