论文部分内容阅读
在很多机器学习任务中,学习过程或者学习环境中存在一些额外可利用的约束,称为“隐式约束”。随着可获取数据量的不断增大和数据环境的越来越复杂,如何充分利用隐式约束来提高学习效率和泛化性能,近年来得到了越来越多研究者的关注。尤其在很多实际问题中只能提供少量的标记信息,利用隐式约束能够带来学习性能上更大的收益。本文针对半监督学习,试图通过利用隐式约束来提高学习性能,主要取得了以下创新成果:第一,提出了一种新的协同训练学习方法CoSnT。该方法受到现实世界教学过程的启发,通过考虑“教”者教学的置信度和“学”者学习的需求度,利用学习过程中隐含的这一教学约束,同时考虑了协同训练过程中两个学习器之间的交互。实验结果表明,CoSnT方法在学习性能上优于传统的协同训练方法。第二,提出了一种新的针对示例对的距离度量学习方法PSD。该方法利用了学习环境中自然存在的连接约束,针对不同示例对可能存在不同的语义连接关系,提出了示例对距离度量。实验结果表明,PSD在多类数据和多标记数据上,都能学习得到相对更恰当的距离度量,从而帮助得到更好的分类性能。