【摘 要】
:
本文主要针对半监督学习中的聚类算法展开研究:1.提出了3-集合相似性度量,它是一种包含结构信息的非欧空间度量。在相似特征集、排斥特征集和仲裁特征集的基础上,提出了新的
论文部分内容阅读
本文主要针对半监督学习中的聚类算法展开研究:1.提出了3-集合相似性度量,它是一种包含结构信息的非欧空间度量。在相似特征集、排斥特征集和仲裁特征集的基础上,提出了新的相似性度量和新的聚类算法:权吸引子传播算法。2.提出了融合3-集合相似性度量、半监督学习策略和吸引子传播算法的种子吸引子传播算法。它降低了文本聚类算法复杂性,避免了随机初始化和陷入局部极小的缺陷,提高了准确率,并具有更好的鲁棒性。3.提出了融合增量学习的增量吸引子传播半监督聚类算法。该算法将标记样本的先验信息嵌入到相似性矩阵中并运用增量学习策略将它们扩散开来。实验结果表明新算法具有更优良的性能。4.分析了已标记样本数量对半监督聚类算法的影响。5种算法在3个数据集上的实验结果表明:已标记样本数目的增长能够帮助半监督聚类算法获得更好的性能。但当数目增长超过关键点位置时,这种改进将变得迟缓甚至停滞。5.分析了未标记样本数量对半监督聚类算法的影响。4种新的半监督聚类算法在3个数据集上的实验结果表明:在多数情况下,较少未标记样本的增量学习能够帮助半监督聚类算法得到更好的结果。但是,未标记样本规模增长超过关键点时,改进将减少甚至起反作用。
其他文献
描述了贵阳供电局如何通过全方位信息化监控系统的建设和管理制度的完善来实现IT运维的自动化、智能化管理.降低人工工作量、保障信息化建设的有序推进。
研究了高效液相色谱法测定鱼腥草和甜茶中的糖.样品中的糖提取液用Waters Sep-pak-C18固相萃取小柱预分离,以Waters carbohydrate高效糖柱为固定相,乙腈-水(体积比70:30)为流动相分
1996年1月,西藏著名历史学家恰白·次旦平措、诺章·乌坚、平措次仁等先生用藏文撰写的《西藏通史一一松石宝串》一书汉文版正式出版。一部全书长达千余页,近百万字,内容时间
制作具有“外焦里嫩”的质感菜肴必须恰当掌握选料、挂糊、油温和上菜时间。它们相辅相成,缺一不可,最终目的是使菜肴营养合理、成品绿色环保,满足人们的需求,适应未来社会。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
20世纪 70年代东西方关系的缓和作为冷战期间的一个有机组成部分 ,其实质仍然是两极体系下的对抗 ,是恐怖下的平衡 ;但由于冷战的结构演变和美苏国内国际战略策略的调整 ,缓
针对传统模糊C均值(fuzzy C-means,FCM)算法以及结合空间信息的相关改进算法分割精度较低、对噪声敏感的问题,提出一种自适应灰度加权的鲁棒模糊C均值图像分割算法。首先,通过
<正> "乾"?是六十四卦中的一卦,《周易》把它排在众卦之首.自东汉以还,世人对之诠释纷纭.察其言论,拘泥于以卦释卦而已,乃至各句爻辞之释义,互不连贯,缺乏逻辑联系.拙作拟从"