一个基于语义信息提取的互联网情报挖掘系统的设计与实现

被引量 : 0次 | 上传用户:xuthusboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的高速发展,Web已经成为世界上规模最大的公共数据源。人们可以从Web获取信息,可以通过Web与其他人交流,可以在Web上共享自己的信息。然而由于Web数据规模如此庞大,如何从中快速准确的检索到用户所需要的信息是一个急迫需要解决的问题。针对这一问题,在信息检索领域中的Web数据挖掘便应运而生,并且伴随着Web的发展而备受关注。Web数据挖掘它建立在信息检索、数据挖掘以及知识管理等技术的基础上,通过对大量的Web文档进行分析来获得隐含的知识和模式,从而帮助人们更好的进行信息检索和决策制定。本文分析了Web数据挖掘的研究内容和研究状况,设计并实现了一个基于语义信息提取的互联网情报挖掘系统,具体的内容包括:1.实现并分析了Web页面提取、网页正文提取、自然语言处理以及关键字信息抽取等子系统模块;2.提出并实现了语义关系图的构建模型,该模型用图的形式表示非结构化的文本数据中的语义关系;3.实现了一种频繁子图挖掘算法,该算法不同于单纯的深度遍历和广度遍历算法,存效率上优越于前两者;本文将该算法应用于挖掘潜在的频繁语义子图,得到具有一定客观性的语义关系图;4.提出并实现了一种基于Linked Data的RDF链搜索算法,用Linked Data解析频繁子图,从而获得具有标注关系的语义关系图。
其他文献
产品的质量特性是表现产品使用中长期保持良好性能的多种特性的集合,是影响产品综合质量水平的重要指标。由于使用对象、应用环境和生产条件等因素的不同,军用装备和民用产品
本文探讨在"一国两制"框架下澳门财政预算透明问题。从政府内部预算信息、对外发布信息的完整性、公众和议会参与预算制定等探讨预算的形成、执行及评估的过程。分析结果显示
五帝、夏商周历史纪年问题一直是困扰中国上古史研究的难点问题,此问题的解决对于五帝、夏商周时期的历史研究,弄清中华五千年文明史都具有重要的意义。多年来,这一问题一直
针对变频器的漏电检测系统,本文提出改进方案,采用零序电流互感器检测方式,并利用DSP对采样信号进行智能处理.本方案解决了由于电磁干扰引起误动作保护的问题,提高了检测的准
信息资源共享是图书馆学研究中的重点课题,而且公共图书馆实现信息资源共建共享是衡量国家图书馆事业发展水平的重要标志。网络环境下,我国公共图书馆普遍面临着信息增长与经
随着新课程改革的逐步推进,新课程改革中培养学生创新精神和创新意识的目标进入人们的视野。无数研究者指出提高学生的问题意识是培养其创新精神和创新能力的前提,然而,教师
为了研究多连拱防护门在化爆荷载作用下的动力响应特性,采用ABAQUS有限元软件分别建立了平板防护门和多连拱防护门有限元模型,并对其在4种等效化爆荷载作用下的结构响应作了
目前中国燃烧器市场被国外少数几个品牌垄断,本论文的研究将会有助于包含国产品牌在内的弱势品牌燃烧器的市场开拓。因为X燃烧器公司进入中国市场已有11年多,前6年也一直属于
随着经济增长和人民生活水平的提高,现代建筑数量不断递增,中央空调得到了广泛的应用。在整个建筑物能耗中,空调系统占40-60%以上,冷水机组能耗约占空调系统总能耗的70%,而我
一、物流企业风险界定 物流企业以客户为服务对象,以产品为中心展开加工、包装、储存、运输、装卸、配送等物流活动。物流企业风险是指对物流企业具有严重威胁的不确定性事件,