基于搜索引擎的知识发现

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:nancyloveme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘一般用于高度结构化的大型数据库,以发现其中所蕴含的知识。随着在线文本的增多,其中所蕴含的知识也越来越丰富,但是,它们却难以被分析利用。因而,研究一套行之有效的方案发现文本中所蕴含的知识是非常重要的,也是当前重要的研究课题。该文利用搜索引擎Google获取相关Web页面,进行过滤和清洗后得到相关文本,然后,进行文本聚类,利用Episode进行事件识别和信息抽取,数据集成及数据挖掘,从而实现知识发现。最后给出了原型系统,对知识发现进行实践检验.收到了很好的效果。
其他文献
电子商务协议需要满足一定的安全特性,其中一个特性是时限性。时限性是指协议中各个主体的行为必须在规定的时间范围内完成,而对于违反了时限要求的主体行为,这类协议都应能够追
随着新课改的发展,对小学低年级科学课堂的要求也不断提升。与此同时如何进行有效的低年级课堂管理引起广泛教师的关注和重视。笔者基于正面管教的学习,结合实际教学经验,从学生的认知、情感和课堂管理出发,浅析正面管教理念下小学科学课堂的管理策略。  小学科学课第一次进入一、二年级课堂,对于孩子的科学素养养成有着重要的意义,但对于老师却是一次挑战。正面管教是一种既不用严厉也不用娇纵方法去进行课堂的管理,它以相
论文针对旅行商问题,提出了一种新型的单亲遗传算法。它在同一条染色体上采用基因换位、基因段移位、基因段逆转和基因分组定界等操作进行基因重组,取消了传统遗传算法中的交叉
场景的交互性操作是地球三维可视化的重要研究内容。尽管人们通过直接滤波欧拉角来平滑方位数据,但是平滑欧拉角未必会产生平滑的运动,这是由旋转群和欧氏空间之间的度量单位的差异引起的。Hamilton于1853年发现的四元数提供了描述旋转的途径。文章首先讨论了四元数的一般原理籍优越性;接着论述了三维虚拟地球的建模方法,采用四元数技术实现了三维地球的任意旋转的问题;最后在数字地球原型系统上进行了实验研究,实