面向互联网数据的知识表达与推理

来源 :浙江大学 | 被引量 : 0次 | 上传用户:whsdht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识表达与推理是人工智能的领域之一,旨在将现实世界中的信息表达为一种计算机系统可以利用并解决复杂问题的形式。知识表达主要研究如何表达知识以简洁地设计和构造系统解决复杂问题,而知识推理则寻求知识之间的逻辑关系以自动化地进行各种推理与论证。在人工智能的研究中,这两个过程是相辅相成、互相促进的。模态、形式多种多样的互联网知识数据,可以大致分为静态、结构化数据与动态、非结构化数据两种类型。对于静态、结构化数据,知识表达的主要目的是将符号化表示的、不可计算的数据转化为数值表示的、可计算的形式,知识推理的主要目的是补足数据集中不完备的部分;而对动态、非结构化数据,知识表达的主要目的是建立数据库内的结构化信息,而知识推理的主要目的在于从学习数据之间的关联模式,从数据集中提取重要或有趣的信息。基于以上观察,本文旨在对两类互联网数据扩展知识表达与知识推理的算法研究,以实现对互联网知识数据的有效利用。总之,本文围绕互联网数据的知识表达与推理问题展开了一系列相关研究并取得了以下成果:对于静态、结构化数据,本文重点研究了知识图谱的嵌入工作,提出了一种由知识图谱嵌入衍生出的双线性学习框架。该框架基于最大边缘的多关系排序模型,以同时解决实体嵌入与实体之间的关系预测这两个任务的方式建立了联合优化模型。该模型具有模拟知识图谱中各种关系的内在相关性以及表达了知识图谱中的多关系结构的能力。为了更好地表达和推理知识图谱中的高阶语义信息,本文通过对实体嵌入与关系嵌入这两个不同但相关的嵌入问题进行联合优化的方式,利用知识库中的高阶上下文信息实现各个实体和各种关系的显性表达,将知识库的内在拓扑结构形象地表达在嵌入空间中。对于动态、非结构化数据,本文重点研究了具有代表性的新闻文档演化跟踪问题,提出了一种上下文相关的新闻知识发现方法。该方法使用了基于新闻文档时序连接的稠密子图学习技术,自适应地顺着时间维度构造文档之间的连接网络。通过充分利用新闻连接结构信息的稠密子图学习方法,可以有效地发现新闻间的事件模式。基于此方法构成的连接网络,可以实现快速而准确的新闻文档推理。
其他文献
【正】传闻:易华录河北项目金额有变。记者连线:记者致电公司证券部,工作人员表示并未接到河北项目金额有变的通知,目前该项目合同仍处于政府正常审理过程中。易华录(300212)
目的探讨螺旋CT增强扫描的技术。方法采用螺旋CT进行双期或延迟扫描,用非离子造影剂优维显300mg/ml,总量75~100ml,按照1.5~2.0ml/mg,注射速度2.0~3.0ml/min,由高压注射器自动注射,注射完成时
本文结合《企业资源计划》课程教学大纲的要求,以金蝶K/3系统为平台,用项目化教学的理论和方法,对《企业资源计划》课程的项目化教学进行了研究。
超高速的无线技术“UWB”是什么? 目前,一种可望取代蓝牙及无线LAN的无线通信技术引起了人们的广泛关注。这就是所谓的“UWB”(Ultra Wideband)技术。正如其名称一样,UWB是一
《动态》:年报披露正盛,华星化工(002018)1月16日晚间公告去年业绩预增28倍,这是目前为止预增幅度最大的一家公司,但股价公告当天却是高开低走,市场似乎不买账,怎么解读?  孔铭:华星化工16日公告,公司2012年度实现净利润10998.72万元至11191.68万元,同比增长2750%-2800%,导致公司业绩预告发生大幅修正的主要原因在于其转让子公司华星建设51%股权的收益得以在2012
【正】国电清新(002573):公司是第一批脱硫脱硝特许营运试点企业之一,近几年业务规模持续扩大。公司2013年收入的70%由运营类业务提供。目前公司运营类业务主要集中在火电脱
目前我们的策略就是逢低吸纳调整到位的前期强势个股,一旦上涨到压力位或布林线上轨就开始获利了结。  市场逐渐失去了1月份攻城拔寨的激情,指数盘中震荡加剧,涨幅也非常有限,成交量或大或小,但始终没能够持续放量,而是维持在了一个区间以内。我们从个股活跃度的统计数据看,自从个股活跃度在1月15日创出高点后,就有逐步回落的态势,虽然目前仍然在做高位平台整理,每天涨停板家数依旧维持在一二十家,但已经没有了过去
期刊