一种半监督局部线性嵌入算法的文本分类方法

来源 :计算机应用研究 | 被引量 : 23次 | 上传用户:psh860525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对局部线性嵌入算法(LLE)应用于非监督机器学习中的缺陷,将该算法与半监督思想相结合,提出了一种基于半监督局部线性嵌入算法的文本分类方法。通过使用文本数据的流形结构和少量的标签样本,将LLE中的距离矩阵采用分段形式进行调整;使用调整后的矩阵进行线性重建从而实现数据降维;针对半监督LLE中使用欧氏距离的缺点,采用高斯核函数将欧氏距离进行变换,并用新的核距离取代欧氏距离,提出了基于核的半监督局部线性嵌入算法;最后通过仿真实验验证了改进算法的有效性。
其他文献
目前,生物医学的研究已集中在寻找新的干预措施来控制寄生虫性公共卫生问题.分子生物学和细胞生物学惊人的成就,提供了发现和评价药物分子靶的机会.DNA拓扑异构酶--"细胞内的
凭借光镜和电镜、切片和涂片技术相结合之手段,作者对斯氏艾美耳球虫(Eimeria stiedai)大配子发育及其超微结构进行了研究.大配子发育历经早、中、晚(成熟)3期.早期虫体以大
分别从长春小白鼠、徐州人和南京黄牛的粪便中分离纯化了3株微小隐孢子虫(C.parvum)卵囊,根据C.parvum 18S rRNA基因序列设计合成引物,用PCR扩增卵囊基因组DNA,其大小为586bp
文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法 TF-IDF中存在的不足,提出了一种动态自适应特征权重计算方法(DATW)。该算法不仅考虑了特征项在文本中出现的频率及该特征项所属文本在训练集中的数量,而且通过考查特征项的分散度和特征向量梯度差以自适应动态文本的分类。实验结果表明,采用DATW方法计算特征权重可以有效提高文本分类
通过刮取重症病犬蠕形螨发病部位的皮屑,用5%NaOH消化2h后进行虫体浓集,将浓集的虫体冻融、研磨、超声破碎,经8 000r/min离心20min,取上清为蠕形螨盐溶性粗抗原;将沉渣用尿素
根据家蝇拟除虫菊酯kdr(knockdown resistance)抗性的遗传标记L1014F突变,设计竞争特异性等位基因PCR扩增方法(cPASA,competitive PCR amplification of specific allele),用
为掌握广西登革热蚊媒动态,采用幼虫监测及诱卵器监测的方法,从2002年5月至9月分别对防城港市企沙镇、合浦县沙田镇、北海市区、东兴市口岸四处的居民区、企业、外来船只进行
可满足问题(SAT)是一个NP-Hard问题。提出了一种求解SAT的新算法(FFSAT)。该算法将SAT问题转换为寻找一个可满足的2-SAT子问题。SAT问题虽然是NP完全问题,但是当所有子句长度不大于2时,SAT问题可以在线性时间求解。使用2-SAT算法-BinSat求解2-SAT子问题,当它不满足时,根据赋值选择新的2-SAT子问题。实验结果表明,采用本算法的结果优于UnitWalk。
基于环的简单扩展性和Petersen图的短直径,提出了一类新型互联网络RPn(k),研究了该互联网络的性质,它不但具有正则性和良好的可扩展性,还具有比RP(k)互联网络更短的网络直径、更
针对氨氮浓度和硝态氮浓度之间相互耦合,以及常规的PID控制方法难以获得满意控制效果的特点,以溶解氧浓度和内循环流量为操作变量,采用PID神经网络对氨氮浓度和硝态氮浓度进行解耦控制;针对PID神经网络连接权值容易陷入局部最优值,应用免疫算法优化PID神经网络连接权值。仿真结果表明,该方法对污水生化处理系统具有很好的解耦能力和控制品质。