【摘 要】
:
随着科学水平的不断提升,多学科交叉汇聚与多技术跨界融合成为常态。重大技术难题的攻克和理论创新需要多个领域的学者共同合作完成。在浩如烟海的学术信息中如何快速匹配出与自身研究兴趣相近、科研水平相当的合作者成为了学者合作的关键问题。然而,在学术领域学者个人属性信息具有多样性、动态性、学术网络具有稀疏性等问题,致使传统的推荐算法已无法满足学术合作的个性化推荐。因此,本文使用社团划分技术和网络表示学习算法解
论文部分内容阅读
随着科学水平的不断提升,多学科交叉汇聚与多技术跨界融合成为常态。重大技术难题的攻克和理论创新需要多个领域的学者共同合作完成。在浩如烟海的学术信息中如何快速匹配出与自身研究兴趣相近、科研水平相当的合作者成为了学者合作的关键问题。然而,在学术领域学者个人属性信息具有多样性、动态性、学术网络具有稀疏性等问题,致使传统的推荐算法已无法满足学术合作的个性化推荐。因此,本文使用社团划分技术和网络表示学习算法解决合作者推荐问题,通过融合多种学术特征,提出了一种基于多学术因子的合作者推荐模型,提高了个性化推荐的精确度。主要研究内容如下:(1)学术网络模型的构建。针对学术合作模式和学者信息属性多维度问题,构建了基于“学者-论文”的科研合著网络和基于“学者-关键字”的研究兴趣网络,并从复杂网络科学的角度进行分析,发现学术网络具有明显的“小世界”现象,同时学者研究兴趣列表长度与研究兴趣网络的平均聚类系数呈负相关。(2)学术合作信任区的构建。针对学术合作网络具有社团结构,学者们倾向于选择和社团内部的学者合作,从而形成学者合作信任区。为了提高学术信任区划分精度,提出了一种基于链路优化的社团划分算法,预先对链路节点相似度进行预估,通过删减小于标定相似度阈值的冗余链路优化网络结构,利用算法挖掘出了学术网络中的潜在社团结构,精准的定位了学者的合作信任区。(3)合作者推荐模型的构建。首先,利用链路优化社团划分算法获得学者的合作信任区和兴趣信任区;其次,利用Node2vec算法提取两种学术信任区中学者的特征向量即Collaborate2vec和Interest2vec,并将两种学术向量进行融合,以融合向量间的相似性表征学者间的合作可能性;最后,通过计算合作信任区内学者之间的相似度并结合学者学术影响力,为目标学者生成具有合作潜力的推荐列表。结合现实场景的推荐结果表明,该模型具有较好的推荐效果和应用性。(4)学术搜索引擎的设计与实现。将合作者推荐模型应用到学术搜索平台中,为科研人员提供更为全面的学术服务,进而验证了该推荐模型的实用价值。
其他文献
在大量图像数据集的支撑下,基于深度学习的图像修复模型能够更好地捕捉图像中隐藏的高级特征和深层结构,达到更贴近图像特点和人眼视觉的修复效果。结合基于深度学习的图像修复技术对唐卡图像不规则破损区域进行模拟修复,既能够保证修复的效率和质量,还可以避免给唐卡带来二次伤害,对实现唐卡的数字化保护有着重要的社会文化意义和学术实践价值。本文以唐卡的数字化保护为出发点,实现了深度学习在唐卡图像修复中的研究与应用,
目前,图像目标检测已经变成图像处理以及工业领域重点研究的方向之一,其主要任务是从图像中定位目标并对目标种类进行判断。随着图像领域人工智能化的发展,深度学习中神经网络方法逐渐代替了传统的图像处理方法,并在图像目标检测领域取得了巨大的成果。图像目标检测通常会受到光线、目标大小、目标清晰程度的影响,从而导致目标检测的鲁棒性变差。传统目标检测使用窗口滑动的方法去解决图像目标检测的问题,这种方法会消耗大量的
汉字到盲文自动转换是改善我国1700万视障人群生活学习的重要技术。我国先后制定了现行盲文、双拼盲文、国家通用盲文三种盲文标准。由于我国汉盲转换软件欠缺、技术落后,导致非出版及电子盲文资源缺乏,无法满足视障者需求,盲文出版、盲人教育事业也受到限制。现有汉盲转换方法均采用多步转换方法:先对汉字文本进行盲文分词连写,再对汉字进行标调,最后结合分词和标调信息合成盲文文本。该方法需要同时建立盲文分词连写语料
随着社交媒体的飞速发展,社交网络成为人们进行信息交流的主要场所。社团结构作为社交网络的重要特性之一,研究社团结构有助于分析社团形成和网络内在特征,进而对社交网络进行控制与预测。本文研究了相互作用的双层社交网络的社团挖掘算法及其应用。结合传统社团挖掘算法,提出了两种社团挖掘算法并在某双层通信社交网络上成功应用。研究内容如下:1.基于节点相似性,提出了一种链路优化的PL(Priority Louvai
数据预测在诸多方面都有需求,但是实际使用时难度较大。当前各行业使用的数据预测方法层出不穷、各个算法的可适用范围也不相同,这给程序设计人员在使用的时候造成了较大的困难。通常需要专业的知识才可以进行数据预测的模型设计,同时还需要具备一些应用型程序设计知识,才能较成功的呈现出算法的结果。为了解决这些问题,本文将图形化编程的思想应用于基于机器学习的数据预测中,从理论和实践两方面论述如何对基于机器学习的数据
作文自动纠错任务的主要目标是利用计算机手段自动检测并纠正作文中存在的错误。国外作文自动纠错研究开展较早,已经取得了较多的研究成果,也有成功的商业应用。作文自动纠错一直是汉语智能考试的重要研究内容,但是由于问题的复杂性,汉语作文纠错问题至今没有得到很好的解决。通过本研究的开展,不仅能够满足汉语学习者的需求、减轻汉语教师的工作强度,而且对汉语考试自动化有较大的推动作用。本研究成果还能直接应用到自然语言
受限于传输带宽和硬件设备等实际条件的影响,最终在终端显示设备上呈现的图像分辨率无法满足人们的视觉需求,尤其是对于要求高清晰度高细节的医疗图像和卫星遥感领域。近年来,随着人工智能和大数据技术的高速发展,深度学习已被广泛用于图像超分辨率重构中。由于图像超分辨存在一对多的不可逆的病态问题,其本质皆在从一张或者多张低分辨率图像恢复具有丰富细节的高分辨率图像。然而当前大多数算法仅仅简单的堆叠卷积层,导致模型
人机对话系统可以使人们以自然语言同机器进行交互。作为任务型对话系统的重要组成部分,对话状态追踪是系统理解用户意图,做出对话策略的基础,其更新正确与否影响整个对话系统的性能。因此,为实现高质量的人机对话系统,对话状态追踪的研究具有重要意义。随着深度学习技术的发展,对话状态追踪研究进步显著,但仍面临以下问题:模型依赖本体进行状态追踪,但本体难以针对槽位预定义所有槽值;模型对未知槽值识别困难。本文针对以
随着大数据时代的到来,电子商务互联网公司每日会产生高达PB乃至EB的海量数据。因此,运用海量数据指导企业运营和加速产品升级、争夺市场份额,也成为了未来电子商务企业的共识。而传统数据仓库只能对关系型数据库中的GB级别的结构化数据进行简单处理,无法处理PB乃至EB级别的半结构化数据与非结构化数据。为了解决传统数据仓库面对大数据时出现的问题,本文结合当前主流的大数据技术开发了电商大数据分析系统。通过电商
随着全球信息的爆炸式增长,如何从大量的信息中获取有效信息已经变得越来越重要。在互联网高速发展的时代,Facebook、Amazon、微博、微信和抖音短视频等互联网平台的用户在不断增长,大量的用户社交和购物活动会造成信息的过载问题。个性化推荐作为信息过滤的重要手段,是解决信息过载的最有效方法之一。协同过滤算法是目前比较成熟的个性化推荐技术,其主要思想是基于用户之间或项目之间的相似性来进行推荐。然而,