基于本体的可伸缩的社会网络抽取算法的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:nurgul2120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对专业领域社会网络的抽取过程中涉及很多大数据集,将社会网络的抽取应用到一个大的组织(用户群)的时候,提交到搜索引擎中的关键字的数目成为了一个关键性的问题。由于需要将所有结点进行完全配对搜索和计算,大数据集和多关键字在时间和空间上开销太大,因此研究人员提出用部分计算的方法确定结点间关系,从而出现了社会网络抽取的可伸缩性问题。对于社会网络抽取可伸缩性问题的研究,虽然许多学者提出了一些能够有效地降低计算时间和存储空间的解决方法,但仍存在结果准确性敏感于阈值设置等客观条件的问题,即运算的准确度随着客观条件的改变而产生很大差异。本文提出一种基于本体的、具有可伸缩的实现社会网络抽取算法Ontology-Scalabilty,该算法应用本体进行相关领域数据存储并减少搜索引擎中需检索的关键字数目,从而提高网络中结点关系的计算和存储效率。   本文首先介绍了社会网络定义及相关概念、社会网络分析在计算机科学领域中的应用,之后对现有的社会网络抽取算法进行了归纳,并对其中的代表算法作了简要的分析。本文重点讨论了本体的构建,给出了支持社会网络分析的本体的构建方法,在此基础上提出了一个基于本体的、具有可伸缩的社会网络抽取算法,文中详细描述了算法的思想、实现过程及性能评价。   本文的算法计算时间复杂度由传统算法的O(n2)降低为O(n),实验表明该算法相较于传统算法在时间性能上有很大提高。它具有对大数据集的数据进行社会网络抽取时间短、召回率(准确率)高等优点。更重要的是,算法中构建的本体是通过领域性的数据构建,可以重复利用在不同的系统中。  
其他文献
医学影像诊断是医学无创伤性诊断的主要方法之一。医学影像已成为疾病诊断、术前决策、手术导航和术后随访等临床工作的重要依据。面向医学图像的诊断技术研究作为医学和计算
情感是人际交流中重要的组成部分,是态度的一部分,是当代认知科学领域研究的热点问题。目前为止,面对海量数据,以人工的方式进行情感分析已经不能满足需求,迫切需要计算机能
开列正确的操作票是确保正确倒闸操作的前提和关键,也是变电站及电力系统安全稳定运行的保证,本系统采用人工智能理论,在变电站操作规则及线路操作规则的基础上建立规则库,联合Prolog及VC两大开发平台建立推理机;另一方面,针对自动开票专家系统的开发过程中软件重用少、生产效率低的常见问题,我们提出采用构件技术包装系统,提高系统的通用性及可维护性;并且结合方便快捷的图形操作方式,在保证数据一致性的前提下,
信息-物理融合系统(Cyber-Physical Systems,CPS)的概念于2006年由美国国家科学基金会提出。CPS是异构子系统通过网络融合的大型、异构、分布式实时反馈系统,与传统的嵌入式
作为上世纪九十年代兴起的一种新的机器学习技术,支持向量机(Support Vector Machine,SVM)在许多领域都取得了成功的应用。但它的应用其实大多局限于常见的标准化或者说“理想
随着计算机技术和多媒体视频技术的进步,远程视频监控系统也向集成化、网络化和多媒体化方向发展,并且被广泛应用于各种场合。视频监控发展到现在,以嵌入式视频监控技术发展最快
《再就业优惠证》是下岗失业人员再就业时享受优惠政策的主要凭证。为了对《再就业优惠证》的审核、发放等过程进行有效管理和实时监控,迫切需要对《再就业优惠证》发放等过程
无线传感器网络是由大量感知节点自组织形成的网络系统,具有大规模部署、资源受限、自组织等特点。近年来,无线传感器网络受到了越来越多的关注,而且被广泛应用到环境、医疗
医疗保险是社会保障体系的重要组成部分,随着我国经济体制改革的不断深化,建立健全完善的社会医疗保险制度,是切实保障城镇居民基本医疗水平、促进社会经济繁荣发展、保障社会长
解决配送车辆的路由问题,是现代物流系统优化中的关键,也是电子商务中的重要环节。对配送车辆进行优化调度,能够降低企业物流运营成本、提高物流工作效率。车辆路由问题(Vehicle