Hadoop框架下的多标签传播算法

来源 :西安交通大学学报 | 被引量 : 0次 | 上传用户:meinu9090
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标签传播算法的主要思想是利用已标注数据的标签信息预测未标注数据的标签信息。然而,传统传播算法没有区别对待未标注数据与已标注数据相互之间的转移信息,导致算法的收敛速度较慢,影响了算法的性能。针对传统算法的不足,提出了差异权重标签传播算法,算法按标注信息的重要性赋予不同的权重。在解决了大规模特征矩阵相乘问题之后,将提出的差异权重标签传播算法应用到Hadoop框架下,采用分布式计算,实现了能够处理大规模数据的多标签分类算法(HSML),并将提出的HSML算法与现有主流多标签分类算法进行了性能比较。实验结果表明,
其他文献
做好思想政治工作可以充分凝聚党员与党组织力量,加强员工的职业素质与提升整体的文化素质,提升自身的信誉度与社会影响力。加强思想政治工作建设力度,利于协调领导与基层员
本文通过调研分析国内部分高职院校毕业设计存在的问题,以职业能力培养为主线,以就业为导向,提出了高职毕业设计POCE新模式,探索了“学校、企业、学生”三方有效协作的质量考
就音乐师范类专业而言,钢琴是贯穿于学生本科学习生涯的一门主科。以笔者所在的绍兴文理学院而言,音乐学专业的学生虽有一定钢琴基础,但仍存在诸多技术问题,慢练是解决上述技
针对传统集成学习方法运用到木马流量检测中存在对训练样本要求较高、分类精度难以提升、泛化能力差等问题,提出了一种木马流量检测集成分类模型。对木马通信和正常通信反映在
为了使初中班主任更好的管理班级,老师应当使用科学的育人方式与班级管理艺术进行教学。本文率先阐述了初中班主任的育人方式,然后从强化班级风貌建设、建设班干部队伍、建构
针对主题图本体映射中主题上下文语义不易确定,缺少分类信息,但有明确的结构语义特征的特点,提出了A-Sim主题图本体映射算法。首先对主题图中的主题进行分类,利用描述逻辑语
差异化是培训机构获得竞争优势的有效途径.文章对培训机构实施差异化战略的途径、关键、有效性和风险防范进行了初步探讨,对培训机构确立竞争优势,赢得市场竞争有着重要的指
随着现代化信息技术的发展,互联网消费金融在我国取得了迅速的发展。为提高互联网消费金融的服务质量,需要根据时代发展的需求,强化互联网消费金融精准营销的力度。本文首先