【摘 要】
:
近年来,随着移动互联网、物联网、云计算等技术的迅猛发展,网络应用井喷式出现,应用产生的数据呈现爆炸式增长。如何从大规模数据中获取有价值的知识并对其进行深入的计算和
论文部分内容阅读
近年来,随着移动互联网、物联网、云计算等技术的迅猛发展,网络应用井喷式出现,应用产生的数据呈现爆炸式增长。如何从大规模数据中获取有价值的知识并对其进行深入的计算和分析成为了当前研究的热点。目前产生的海量数据中包含着数量巨大的文本数据,人工智能技术的发展离不开对这些文本数据的理解,而开放式信息抽取主要针对文本数据进行信息抽取以供计算机系统理解使用。本文致力于实现从文本中自动抽取特定领域属性和属性值来扩充领域知识库,针对文本结构化信息抽取的相关技术和方法进行了深入研究,并实现了信息抽取系统――DAVE,具体内容包括以下几个方面:1.数据精准采集:设计并实现了定制化的精准数据采集框架,通过多线程策略抓取数据并定制化使用关键词和机器学习等方法对文本进行筛选过滤。2.迭代属性及属性值抽取:本文提出了一种有效的基于图的迭代抽取方法,该方法基于领域属性词和属性值词经常出现在同一句话中,利用这种共现关系来抽取更多的属性和属性值。将与初始知识库中共现的词从抽取出来,与初始的词创建共现图,不断迭代执行直到没有更多的属性或属性值被引入则停止。3.这里还提出了一种卷积神经网络(Conventional Neural Network,CNN)模型来去除抽取结果中包含的噪音数据,引入共现图中节点的度、random walk得分、相邻节点特征等作为节点特征,利用CNN将噪音节点去除,提高抽取质量。本文对文本结构化信息抽取技术进行了深入研究,提出了指定领域新属性和属性值发现算法,可以更好地进行知识库扩展,并通过DAVE系统展示了研究开发成果,具有一定的实用价值。
其他文献
分布式光纤传感技术以其抗电磁辐射、耐化学腐蚀和长距离分布测量等优点广泛应用于交通、地质和建筑等领域的安全健康监测中。作为分布式光纤传感技术之一的布里渊光时域分析(Brillouin Optical Time Domain Analysis,BOTDA)在长距离、高空间分辨率等传感测量方面有着突出的技术优势,因而受到广泛关注。近年来,为打破传感距离、传感空间分辨率和测量精度之间的相互制约,许多信噪比
随着宽带数字信号处理技术的发展,单片模数转换器(Analog to Digital Converter,ADC)的采样率已经不能满足部分高性能应用。分时交替采样(Time Interleaved ADC,TI-ADC)技术
随着汽车工业水平与人们环境意识的提高,驾驶员坐姿舒适性问题越来越受到关注。汽车在行驶过程中机械系统会产生振动,在一定范围内的低频振动会使驾驶员感到不舒适,从而容易引起驾驶疲劳增加交通安全事故发生的机率和风险。因此,研究人体坐姿在动态环境中的振动特性与压力分布状况对汽车座椅设计和提高人体坐姿舒适性具有重要意义。本文建立了一种方法对汽车驾驶员进行人体坐姿舒适性评价研究,该方法主要利用主观嗜睡量表、振动
随着VLSI设计技术和制造工艺的不断发展,集成电路设计的复杂性和系统功能呈几何级增长。目前,复杂的SOC系统已经有千万甚至上亿门级的电路,寄存器传输级的设计流程越来越受到
随着科技的进步与时代的发展,现代通信技术发展迅速、日新月异。经过三十多年增长,改变了人们的生活方式,并成为推动社会发展的最重要动力之一。现代通信技术的进步带动了定位业务的蓬勃发展,因此与之相关的无线定位技术也显得至关重要。目前,人们研究的定位算法在视距条件下已具有很高的定位精度,基本满足人们的需求。但在非视距条件下,由于障碍物的存在信号不能直接到达基站,因此无法得到精确可靠的位置信息。因此,本文在
脉冲超宽带(Ultra-Wide Band Impulse Radio,IR-UWB)技术是近年来备受关注的一种短距离高速无线通信技术,它具有高数据传输率、与其他无线系统共享频谱、安全性高、抗干扰能
在国家大力推行市场化电价的背景下,一座水电站建设成本对于电价的形成具有决定性的作用,它是衡量一个水电企业生产管理水平的关键指标。为了提高我国水电开发企业的市场核心竞争力,提高水电投资回报率,建立一套完整的、系统的对水电站全寿命周期的成本控制的一整套方法进行研究探索,找到适合中国特色水电工程建设全过程的成本控制方法,显得十分紧迫和必要。本文将运用项目管理理论和湖南安江水电站工程建设实践相结合的方法,
作为一个2017年4月正式上市首款车型的自主高端SUV品牌,WEY以其时尚的设计感和比肩合资车型的价格迅速吸引国内市场的关注。然而号称“本土高端豪车”的WEY汽车销量却渐显疲态,2020年5月统计的中国汽车销量榜中,WEY汽车跌到第40名。可以看出消费者对于品牌的认可度和忠诚度并未得到有效提高。而自主豪华汽车品牌近年来纷纷进军高端市场,如吉利领克、红旗、新宝骏等,与WEY在细分市场里激烈竞争。作为
目的:比较前盆腔悬吊术与阴道半封闭术在重度前盆腔脏器脱垂方面的临床疗效,为临床术式的选择提供依据。材料与方法:对2017年1月至2018年12月在南京市第一医院妇科收治的112例重度前盆腔脏器脱垂患者资料进行回顾性分析和术后随访调查,依据所行手术方式,分成对照组(n=35,阴道半封闭术)和研究组(n=77例,前盆腔悬吊术),比较两种患者的围手术期各项指标、客观疗效,PFIQ-7、PFDI-20两项
以BIM为基础的工程数字技术,正在重塑建筑、建筑企业以及建筑行业。数字化转型是传统建筑企业的必经之路。D公司作为T集团内部的专业设计单位,一方面面临自身业务持续增长的