【摘 要】
:
K-means聚类算法在数据挖掘聚类分析方法中是一个基本的、使用最广泛的划分算法。为了对数字图书馆中大量的数字资源进行更加有效、快速的聚类,文中针对传统的K-means算法存
【机 构】
:
燕山大学信息化处,燕山大学信息科学与工程学院
【基金项目】
:
河北省自然科学基金面上项目(F2013203324)
论文部分内容阅读
K-means聚类算法在数据挖掘聚类分析方法中是一个基本的、使用最广泛的划分算法。为了对数字图书馆中大量的数字资源进行更加有效、快速的聚类,文中针对传统的K-means算法存在的问题,结合数字图书馆数字资源的特征,提出了一种改进的基于关键词特征向量的初始聚类中心选择算法,并在此基础上对传统的K-means聚类算法进行了改进,用于对数字资源进行聚类,并进行了算法的实验验证。通过对实验结果的分析证明,文中提出的算法降低了数字资源聚类的代价,提高了聚类的效率,从而验证了算法的可行性。
其他文献
法律基础课有着自身的特征、性质和功能,法律基础课教学在把握其特征、定位其性质和功能的基础上,对相应的教学方法、内容、工具和手段进行创新和改进,就能取得良好的教学效
结合工作实践,以高校教学水平评估为契机,对如何加快推进实验室建设的几点措施进行了探讨。
脓胸是指由于各种原因导致胸膜腔有大量脓性渗出液积聚[1]。产生脓胸的最常见的原因为细菌性肺炎累及胸膜腔,其他原因包括肺癌、食管破裂、胸部外伤、纵膈炎蔓延等[2]。脓胸
新发肿瘤病例上报是国家开展恶性肿瘤防治研究的基础。其目的是为了动态了解恶性肿瘤发病、死亡的变化规律,探索恶性肿瘤的危险因素,为指定恶性肿瘤防治策略提供基础性数据。
2019年12月发现多例不明原因肺炎患者,短时间国家即确认其为一种新型冠状病毒(SARS-CoV-2)感染,EW将其导致的肺炎命名为2019冠状病毒病(COVID-2019)[1]。已被证实具有高度传
目的对左氧氟沙星治疗耐多药肺结核的临床疗效及安全性进行系统评价分析。方法 80例耐多药肺结核患者,随机分为观察组和对照组,每组40例。在联合用药基础上,观察组患者采取左
为了在检索过程中全面挖掘用户查询信息,文中提出了一种基于领域本体的语义合成技术,该方法以文本为数据源,引用数据源和领域本体之间的映射关系来表达数据文本的语义。文章提出
视频编码存储器接口是H.264高清视频编码系统的关键模块,用于快速高效地存储和读取编码过程中产生的大量中间数据(其中主要包括运动估计、宏块信息、去块滤波和码流数据等)。目
文中详细讨论了一组基于UML状态图的软件测试充分性准则。在软件测试时,还没有测试充分性准则明确定义循环应该被执行多少次,而循环只被执行一次是很不充分的。针对这种情况,在