利用表格特征信息的Web文本分类研究与实现

来源 :计算机时代 | 被引量 : 0次 | 上传用户:qiyueliuhua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
构建了关于Web表格特征信息知识的领域本体,提出并设计了一种用于Web文本分类的二次分类模型。该模型使用支持向量机方法对测试样本进行第一次分类;由于设定了较高的分类阈值,一次分类后部分测试样本未确定所属类别,对于这些测试样本,抽取样本中的Web表格特征信息,与基于领域本体的分类模板进行相似度匹配,进行第二次分类。最后通过实验验证了该方法的可行性。
其他文献
水泥余热发电是一项非常有效的节能减排技术,2005年也已被列入我国十大节能工程之一。国家已经给予政策上的大力支持,但在并网运行实际工作中还有许多概念不清及模糊的问题,造成
通过调查与资料分析方法,对广州地区3人篮球赛市场的发展状况进行了社会学的分析,认为有统一的领导和广大群众的爱好是基础,赞助企业的大力支持和传媒的宣传是保证.目的在于
21世纪休闲在中国已成为社会关注的焦点,它渗透到人们的生活、文化、工作的各个领域,运动休闲作为休闲的组成部分,越来越受到大学生的欢迎.文章论述了运动休闲的内涵和功能,
介绍了应用Delphi开发<普通高等学校学生体质健康标准管理系统>的目的、设计过程和关键技术,并在实践中进行大样本数据检验和研究.通过现代化手段,使得<标准>实施工作科学化
针对企业信息门户现有搜索引擎的不足,在企业门户信息检索中引入Agent技术,提出一个基于Agent的门户信息智能检索系统APIIRS(Agent Portal Information Intelligence Retrieval
随着投资体制改革、财政金融体制改革和财会制度改革的不断深化,仅依赖于现有的基本建设管理体制和管理办法已经无法适应社会主义市场经济体制和依法治国、依法行政的要求.财
文章以网络协议教学为例介绍了对网络类课程的教学手段的改进和实践。对多媒体辅助教学、网络编程辅助教学和协议分析器辅助教学三个方面,根据教学实践分析了它们各自的优缺点
早期从事各类专业体育项目训练的青少年运动员都时常在骨和关节部位出现一种不明原因的疼痛,而且治疗无效.鉴于这类问题我们进行了长期前瞻性和回顾性调查.结论是:这是一种称
简要介绍了WAP的工作原理及开发WAP应用的WML语言,结合北方工业大学师生互动信息系统的开发实践,提出了一种基于该原理的师生信息服务系统方案,实现了手机平台上的公告管理、消
随着我国教育深化改革,突出了"体育教育"的多功能全方位的综合训练和治理的重要作用,相应对中学体育教师的"工作能力"提出了更高而全新的要求,而"工作能力"又是一个带"模糊性