聚类算法研究及在学分制下高校专业自动分类中应用

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:li452546674
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域广泛使用的一种技术,可以自动发现隐含在数据集中的分类模式。 本文在充分分析数据挖掘的相关理论与方法的基础上,详细研究了各种有代表性的聚类算法,并对其各自缺点与优势以及所适应的具体领域进行了分析对比,给出了挖掘大型数据库的几种方法,并应用于学分制体系下的学生选课数据。这些数据可以看作分类属性的数据或布尔型数据。通过研究表明,使用距离作为测度的传统聚类算法并不适合处理这类数据。在分析数据集特点的基础上,本文提出了使用ROCK算法进行学生专业自动分类的方法。 ROCK算法用公共近邻点数来衡量两数据间的相似性,这样有利于考虑数据分布的全局特征,具有良好的聚类特性和可扩展性。通过在开发的模型系统上进行实验分析,得到了较好的实验结果,对较好的解决学分制体系下学生专业自动分类问题具有积极意义。
其他文献
异步传输模式(AsynchronousTransferMode)是目前已知的一种最适合于宽带综合业务网(BISDN)的网络数据交换方式。如何根据服务的通信流量特性和QoS参数,对ATM网络的VPC进行网络
随着我国近红外光谱分析技术的逐步成熟,其应用的领域也越来越广泛,该项技术已经成为食品、医药、石油等各个行业生产优化所必需的重要分析技术之一。为了适应全球石油短缺和
基于角色的存取控制模型RBAC是目前信息安全领域中的主流。RBAC中角色概念的引入使得用户和许可操作相分离,极大的简化了权限管理;与传统的存取控制模型相比,RBAC模型是一个策略
21 世纪,网络和信息化建设日新月异,网络信息安全等问题始终是大家关注的焦点,作为信息安全关键和基础的PKI技术,通过可信第三方证书权威机构(CA)颁发的数字证书,为网络上的
本文研究基于预测的无失真数据压缩的细胞自动机及用量子遗传算法在细胞自动机规则演化中的应用。基于细胞自动机的无失真数据压缩可以并行地生成无损压缩的预测编码,本文在原
多主体系统是近年来人工智能研究的热点,由于它能够很好的体现人类的社会智能,适合开放、动态的世界环境,因而引起人们广泛重视。然而,传统的方法并不能有效的解决涉及多种社会协
随着网络信息共享的发展,XML已经成为数据交换描述语言的标准。对XML资源的安全访问的研究也越来越受到重视。目前,主要的XML访问控制策略有:(1)文档级别(document-level)的访问
关系数据库上关键词检索研究如何在关系数据库系统中提供类似搜索引擎的关键词检索能力,使用户可以不用了解关系数据库的模式信息,也不用掌握SQL语言就能方便的检索数据库信息
随着信息技术、现代通信技术和多媒体技术的高速发展,军队指挥系统的数字化、智能化、网络化、可视化已成为必然的发展趋势。东北大学网络与通信中心提出了远程网络可视指挥系
OWL是W3C提出的Web Ontology语言,用于描述Web资源。OWL-Lite是OWL的一个子语言,它包含了OWL大部分的构造符,提供了较强的语义表达能力,同时与OWL的其它子语言相比,其推理具有较低