基于Ontology的Web文本分类法

来源 :情报学报 | 被引量 : 0次 | 上传用户:one_tester
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统方法处理文本分类时都需要进行文本训练,并且在文本表示时需要抽取特征项。搜集训练文本的过程需要费时费力的人工参与,而且中文信息的特征项抽取工作难度较大。为了解决这些问题,本文探讨了一种新的文本分类法——基于Ontology的Web文本分类法。该方法首先通过“知网”建立一个Ontology,然后根据分类体系建立每个类的Ontology,最后根据每个类的Ontology对文本进行分类。试验表明这种分类法与KNN分类法在准确率上相当,但比KNN方法稳定,在召回率上优于KNN方法。
其他文献
为分析轮作对棉花根际土壤细菌多样性及群落结构的影响,以棉花为研究对象,花生和谷子为轮作材料,应用IonS5^TMXL高通量测序平台对各处理土壤样品进行16S rDNA测序。结果表明,
本文提出了一种适合机器翻译的标记语言MTML(Machine Translation Markup Language).针对机器翻译研究中对混合策略处理的需求,我们将传统的机器翻译方法与模式匹配及XML等技
课题组选取20个具有代表性的调研对象,摸清全市公共机构绿色数据中心(机房)现状,结合全球发展趋势,提出相关对策与建议。
<正>自身免疫性溶血性贫血(autoimmune hemolytic anemia,AIHA)系指各种原因刺激自身抗红细胞抗体的产生导致红细胞寿命缩短,过早破坏的一种较常见获得性溶血性贫血。由于临
个性化推荐技术是将传统的数据挖掘技术同用户访问信息结合起来,根据用户的兴趣爱好来对用户可能访问的内容进行预测并预取其提供给用户进行选择。目前协作过滤技术是个性化推
【教学内容】义务教育课程标准实验教科书《语文》(人教版)四年级上册。【片段】一、课件辅助,感知特点1.自由读文。(读第三、四自然段,边读边画出描写爬山虎脚的生长位置、
妊娠高血压疾病是常见的孕期并发症,为孕产妇和围生儿死亡的主要原因之一。如果对其及早识别进行干预管理,可以阻止其发生、发展。2009年1~12月对我院170例妊娠高血压疾病高危孕妇进行干预管理,取得满意效果,现报道如下。
目的探讨肝门胆管癌的外科治疗与预后。方法回顾性分析我院自1999年6月-2005年6月93例肝门胆管癌患者的外科治疗情况,并分析影响其预后的因素。结果93例肝门胆管癌病人中根治
基于作者建立的无弹性悬链线解答,推导了拉索的无应力索原长计算公式,以及索原长与索力之间的增量关系式.算例表明,本文建立的索原长计算式是正确的;索原长与索力之间的增量
本文设计并实现了一个多模态的新闻视频处理系统NVPS,该系统通过对视音频特征进行多模态的综合分析来获取新闻视频高层的语义内容,以支持用户语义层次的检索.对新闻视频处理