【摘 要】
:
协同标注作为一种成熟的技术,常被用来解决信息资源索引、管理、检索等问题,但存在因数据间交互信息不充分或无交互信息带来的冷启动问题。目前常用的解决办法是采用内容信息来增强和改善注释算法,尤其是基于文本内容的协同过滤,但对于如何更好地提取文本特征、衡量项目相似性等还需要深入探究。针对以上问题,本文结合稀疏线性方法(Sparse Linear Method,SLIM)和孪生卷积神经网络(Siamese
论文部分内容阅读
协同标注作为一种成熟的技术,常被用来解决信息资源索引、管理、检索等问题,但存在因数据间交互信息不充分或无交互信息带来的冷启动问题。目前常用的解决办法是采用内容信息来增强和改善注释算法,尤其是基于文本内容的协同过滤,但对于如何更好地提取文本特征、衡量项目相似性等还需要深入探究。针对以上问题,本文结合稀疏线性方法(Sparse Linear Method,SLIM)和孪生卷积神经网络(Siamese Convolution Neural Network,SCNN)提出了一种基于相似度神经网络的协同标注模型(Similarity Neural Network based Collaborative Annota-tion Model,SNNCA)。该模型将SCNN组件用于内容信息的特征提取和项目相似性计算,其输出可视为两个输入内容的非线性相似性度量函数。为了解决SCNN的参数训练问题,本文通过SLIM从已有项目标注数据中学习项目间的相似关系稀疏系数矩阵W,将获得的结果用于训练SCNN组件中的参数。基于此思路,本文专门设计了模型参数学习方法,并通过交叉迭代方式,实现模型参数的联合优化,即每次迭代,固定SCNN组件参数,通过坐标下降法求解SLIM参数W;然后固定W作为SCNN组件的训练标记,通过后向传播方法求解一个最小二乘问题,实现SCNN组件参数的更新。本文创新之处在于引入神经网络组件衡量项目内容的相似性,并与基于项目的协同过滤模型有机结合,同时解决了特征提取、相似性度量学习等问题。本文采用从CiteULike和ProgrammableWeb收集的三个不同维度的标签数据集来检验所提出模型的性能。经过全面实验,验证了所提出模型的有效性。通过量化对比后发现,所提出的模型比基线模型在推荐准确度和查准率上提高了 3%-11%。经过不同维度的对比分析后发现,内容信息的表示越丰富,模型的性能也就越优异,并且数据集的稀疏性越大,则模型的性能越突出。
其他文献
冰冻天气引起的电线覆冰灾害对湖南地区的影响十分严重。本文利用了19972016年的地面观测资料以及垂直探空资料对我国雨凇时空分布及湖南地区雨凇空间分布、年际变化、月变化及垂直结构进行了分析。利用统计出的湖南地区适宜雨凇发生时的个气象要素阈值将Ramer算法参数化进行改进,基于WRF模式分别对2011年1月15日及2015年1月2729日两个典型个例中的液水含量、温度场、水成物及降水强度等气象要素进
软件开发项目与其他项目相比,特点在于开发任务工作量估算难度较大,当软件功能在实现之前,其所对应的风险和不确定性很高。作为一个智力密集型的行业,软件开发人员面对无形的
近年来光纤传感技术在国民经济的各个领域获得广泛应用,其中反射式强度调制型光纤位移传感器(reflective intensity modulated fiber optic displacement sensor,RIM-FODS)由于检测方便、设计灵活、性能稳定、成本低廉等优点,获得用户广泛青睐。另一方面,现代通信工业对传输容量和传输速度提出了越来越高的要求,传统单芯单模光纤已经不能够满足目前光
我国当前居高不下的房价已引起政府、学界与媒体的广泛关注。房地产行业拉动国民经济快速发展的同时也因过高的房价产生负面作用。本文利用1997至2015年非房地产上市公司企业数据与省市级层面数据,从微观企业层面出发,探讨房地产价格上涨对我国企业创新行为的影响,并进一步分析其内在传导机制。研究发现:第一、房价上涨显著降低了我国企业的创新投入与创新产出。为控制房价与创新之间可能存在的内生性,本文引入土地供给
行人检测及再识别技术可以判断一个人是否进入某区域,实现可疑人跟踪,对于智能安全系统的开发和应用非常重要。伴随着第四次“工业革命”的来临,以深度学习为代表的人工智能发展迅速,机器视觉得到了前所未有的突破性进展,并在智能监控、智能辅助驾驶等相关领域得到了应用。其中机器视觉中的行人检测及再识别技术得到了相当广泛的研究及关注。论文以行人图像为研究对象,在阐述常用的目标检测及再识别算法基础上,提出了基于改进
近年来,多智能体系统的一致性协同控制在诸如生物集群、传感器网路、多合作机器人、水下作业船、无人机、编队控制、通信拥塞控制等领域得到广泛的关注和发展。但是,在考虑到实际约束和能量优化的条件下,针对多智能体系统一致性问题设计分布式的控制策略,依然具有很大的挑战性。本文主要研究针对多智能体系统的一致性问题,设计相应的分布式预测控制策略。首先,针对二阶采样多智能体系统的一致性问题,提出了一种分布式的预测控
近年来,随着深度相机的广泛应用,实时三维手部姿态估计成为了研究热点。手部姿态估计可以在人机交互、虚拟现实和增强现实等应用中发挥重要的作用。深度学习不断发展,并在各个领域显示出强大的生命力,为手部姿态估计问题带来了强有力的技术支撑。基于数据驱动的深度学习方法在实际应用时计算复杂度低,速度较快,可以满足手部姿态估计问题实时性的要求。因此,基于卷积神经网络的手部姿态估计方法成为三维手部姿态估计领域的主流
背景及目的:目前研究者多采用单个肝脏衰竭(即APASL标准)的标准鉴别乙肝相关ACLF患者。ACLF患者生存率的提高主要依赖于早期识别有MOF发生倾向的肝硬化AD患者。对于肝硬化AD
中国目前处于体制转型时期,权利已逐渐从政府下放到市场,但政府仍对土地、财政等部分资源拥有自由裁量权。因此,政府与市场共同对资源起到配置作用。企业家在谋求发展所需资源时主要存在两种方式:一是提升企业实力通过市场竞争获得更多资源,二是通过寻租的方式与某些掌权者建立政治联系来获得政府性资源。政治联系在世界范围内普遍存在,但在不同社会体系中,政治联系所发挥作用也存在差异。中国的社会文化将关系视作一种重要的
下雨是一种常见的天气现象,在雨天采集到的图像由于雨滴的干扰,会导致图像质量下降,严重影响后续的图像分割、目标识别等工作,因而对图像中的雨滴进行去除的方法已成为计算机视觉和人工智能领域的重要研究内容。本文对单幅图像雨滴去除方法进行研究,针对目前滤波等雨滴去除方法只能去除图像中的雨线条纹,深度学习的方法对样本依赖度过高且训练过程复杂等不足;在对雨滴进行物理建模的基础上,引入图像复原中经典的TV模型对不