基于数字电视节目的相关语义库的实现与应用

被引量 : 0次 | 上传用户:houjinlei11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人们对语言的感官认知中,判断词语间的语义相关程度一直扮演着一个重要的角色,同时,这种语义相关关系在很多领域中都有实际的应用,例如信息检索,文本分类,机器翻译等等。构造相关语义库通常有基于知网和语料训练两种方法。知网采用人工方法,主观性太强,且不能动态更新;通常的语料训练对时空复杂度的要求都比较高,受语料稀疏和语料噪声的影响也比较大,不宜直接应用于嵌入式环境。为了解决以上问题,本文提出了一种以向量空间模型为基础的相关语义库的构造方法。本文将所要介绍的相关语义库称为Corpus库。本文首先提出了Corpus的逻辑模型,Corpus库综合考虑了多种与词语间语义关系有关的因素,创新性地将词语之间的共同出现次数、平均距离、窗口大小、信息熵、单字匹配等概念引入模型。接下来,我们给出了训练词语相关度的裁剪公式,在构建相关语义库过程中,依此公式对大量语料进行了多次迭代式学习以尽量控制空间大小。其中,我们对模型中相关词空间各个因素进行统计,针对每一个词语,根据与其相关的词语的统计信息,为这些相关词语分配权值,最后按照权值大小进行排序,排位靠前的相关词语会被最终留下存入主词语的相关空间。本文针对Corpus自身模型和Corpus应用做了两个实验。实验一证明了用这样的构建方法得到的相关语义库能够较好的反映现实世界中词语之间的相关程度。实验二提出了一种基于Corpus库的模糊信息匹配模型,它基于一个四维的向量空间,在模糊匹配的过程中该模型会用扩展后的检索信息与待查全部文本资源进行匹配,并得出最终的检索结果,该实验证明结合相关语义库的模糊匹配能够检索出更丰富的与检索需求相符的信息。
其他文献
目的:观察腹腔置管引流术后重症急性胰腺炎(severe acute pancreatitis,SAP)大鼠血清及腹水IL-6、TNF-ɑ浓度以及肠液sIgA水平、肠组织CD4+T淋巴细胞浸润程度的变化规律,旨在探
重型车辆(尤其是重型半挂车)具有重量和尺寸大、质心高等特点,与其他公路车辆相比,其侧翻稳定极限较低。因此,提高重型车辆(包括半挂车)的侧倾稳定性是提高公路运输安全,减少
对639名中学生进行问卷调查,结果发现,从初一到高三,自我同一性状态呈现出前进的发展趋势,与初中生相比,高二和高三学生更多地处于获得状态、更少处于早闭和扩散状态;除高一
目的:探讨保守治疗旋后外旋Ⅳ度踝关节骨折的疗效。方法:对40例旋后外旋Ⅳ度踝关节骨折的患者进行了保守治疗。其中男性19例,女性21例;年龄16~78岁,平均54岁;左踝15例,右踝25例,均
日本从第二次世界大战后,经历了50多年的国土开发,国土基础骨骼已经形成,由于政府出台的一系列国土综合开发政策,取得了显著成效。本文采取了史论结合、理论与实证结合、文献
目的观察依托咪酯(Etomidate)预处理对犬肝脏缺血再灌注血清中谷丙转氨酶(alanine transaminase, ALT),谷草转氨酶(aspartate transaminase, AST)以及肝组织内丙二醛(malondi
目的:随着人们生活质量的提高以及对医学认识的深入,越来越多的乳腺包块得以早期发现。目前大部分乳腺包块患者均采用局麻下包块切除,但在无镇静的情况下行包块切除及等待病理回
目的:观察胃蛋白酶脱蛋白异种骨移植材料修复兔桡骨缺损的免疫原性。方法:新西兰兔125只,随机分为空白组、胃蛋白酶组、白体骨组、骨基质组、过氧化氢组5组,每组25只,手术造成
目的:探讨七氟醚对神经外科病人丙泊酚静脉复合麻醉中丙泊酚血浆靶浓度及血流动力学的影响。方法:选择大连医科大学第一附属医院神经外科颅内占位择期行开颅手术患者26例。随机
目的:探讨肝移植术后早期感染的相关危险因素,评价血TNF-α在肝移植术后早期感染的诊断价值。方法:回顾性研究2004年3月至2010年4月117例同种异体原位肝移植后发生术后感染的临