非结构化信息的形式语义表征与检索

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:metor2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从认知心理学出发,采用范畴理论对文本、图像、视频等非结构化信息做了一个统一的形式语义描述;基于反馈控制和试错法为核心思路,通过合成的虚拟对象与实际对象对比,指导系统得出精确的语义表征。   本文主要研究成果和创新点如下:   1.基于范畴论思想,提出一个抽象的非结构化信息的抽象数据类型ΣUSI;然后扩充为相貌文字表征的抽象数据类型ΣText,定义了形容一个证件照的语言描述,进一步实现了一个相貌中文表征模型。基于ΣUSI扩充为图像表征的抽象数据类型ΣImage,该类型将数据约束为二维数组,并定义了二维数据上的相关读写操作和约束。基于∑Image扩充为相貌图像表征的抽象数据类型∑face,该类型使用五官模板,对标准的证件照进行句法生成,在∑Text的输入下能合成虚拟相貌。   2.基于ΣImage扩充为交通视频表征抽象数据类型Σscene3D,该类型使用Java3D作为句法生成工具,将预定义的3D车辆模型作为模板,使用形式化的交通轨迹描述作为输入,合成虚拟3D交通视频。   3.针对Hadoop数据挖掘的全局性、HDFS随机写问题、数据生命周期等问题,提出了一个在Hadoop云平台上的高效数据挖掘模式。基于该模式,提出了一个Hadoop云平台上的决策树算法,能快速地对海量数据进行分类处理;提出了一个Hadoop云平台上的KD树算法,对海量数据进行索引和检索;提出一个动态哈希TRIE频繁模式挖掘算法寻找知识,为商务决策提供支持。   4.针对Unicode信息处理,提出一个使用哈希表查找子节点的动态哈希TRIE算法,能对模式查找提高速度和发现语义关联;进一步提出了增强动态哈希TRIE算法,解决了哈希表内存消耗的问题,使得不损失模式查找速度和语义关联的前提下,时空性能得到极大改善。
其他文献
目前,校园网系统中普遍以“用户名+静态密码”作为用户身份认证的方式,这种身份认证的方式存在着很大的安全风险,比如静态密码的泄露、非法用户的登录以及用户对于自己所做的
传统的工作流系统无法满足企业构建数据密集型应用的需求,需要借助于Hadoop平台处理大数据的能力。现有的Hadoop工作流系统采用自定义的描述语言构建Hadoop工作流,无法与企业已
智能物件通常是指物理世界中能够在嵌入式设备协助下进行感知、传输环境信息并进行特定操作的物体,而IP智能物件(IPSO)是指使用IP技术进行联网的智能物件。IPSO具备低功耗、
在油田勘探开发研究和应用过程中,地质人员需要通过各种方式收集大量的测井数据、地层数据、砂层数据等油藏数据信息,进行连井剖面的绘制。如何快速方便的完成连井剖面的可视
学位
可定制嵌入式计算机具有可裁剪、体系结构灵活、便于加固等优点,其价值逐渐受到工业、军事、航天等领域的重视。本文在深入分析国内外研究现状的基础上,围绕着可定制嵌入式计算
人脸是最重要的生物特征之一,人脸图像上蕴含了大量的生物特征信息,例如性别、年龄、人种等。基于人脸图像的性别识别及年龄估计是根据人的脸部图像判别其性别及估计其年龄的模
大规模的数值模拟的普遍应用对计算机系统的计算能力提出了很大的挑战,代数多重网格(AMG)作为众多数值模拟应用的核心算法,具有良好的算法可扩展能力和并行扩展性,因此优化AMG的
近年来,虚拟现实(Virtual Reality-VR)技术以其独有的临境性、交互性、想象性在现代医学软件中有着越来越重要的影响。虚拟操作作为虚拟手术软件的重要组成部分,使用传统的I/O
近些年,电子政务、电子商务、企业信息化等信息化应用迅猛发展,互联网开始广泛的渗透到各个行业、各个部门,同时也给整个Internet网络服务带来巨大的压力,对网络服务的可伸缩性提