Web文本挖掘中数据预处理技术研究

来源 :现代计算机(专业版) | 被引量 : 0次 | 上传用户:tianlong3311
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据预处理是将原始的Web文档转化为适合进行数据挖掘的中间表示形式,在Web文本挖掘过程中起着至关重要的作用。介绍Web文本挖掘的概念及Web文本挖掘的一般流程,对Web文本挖掘中的特征表示、中文分词、特征选择等数据预处理关键技术进行详尽的分析。
其他文献
随着经济的发展进步和我国事业单位的不断发展壮大,事业单位的内控制度也越来越受到重视。本文首先阐述了内控制度的概念及其重要性,然后分析了事业单位内控制度方面现存的常
修改后刑诉法确立和强化了检察机关对于非法取证的诉讼监督,并就证据问题的发现、调查、认定与制裁作了相应规定,涵摄非法取证诉讼监督基本流程。文章立足福建检察实际,以具
螺旋藻粗多糖经阳离子表面活性剂十六烷基三甲基溴化铵和乙醇分级,获得多糖级分S1,S2,S3通过硫酸化修饰,合成相应的硫酸酯化多糖SL1,SL2,SL3,并用BaCl2-明胶比浊法确定硫酸基
目的探讨急性冠脉综合征综合护理干预的效果,为临床治疗提供参考。方法对2008年3月—2010年5月和2010年6月—2012年10月两个时间段心内科收治的急性冠脉综合征并恶性心律失常
后殖民主义从西方传入中国,成为反现代性的理论武器。它指认"五四"以来的启蒙思潮接受了西方殖民主义的话语,虚构了一种落后的传统文化和愚昧的国民性。后殖民主义反对西方中
<正>当"网购"成为一种生活方式,网品质量问题便愈加受到关注。产品质量不过关、假冒产品充斥、缺乏有效市场监管等现象,给行业带来不公平竞争,也破坏了正常的市场管理体系。
面对越来越理性的采购者,刚刚进入商品化安装阶段的320CT离中国的使用者似乎还挺遥远
<正>日前,中国纺织工业联合会在京召开全国纺织标准化工作会议,共同探讨纺织标准化工作如何适应新的改革发展形势,充分发挥标准化对产业发展的引领和技术支撑作用,更加有力地
<正> 风水研究和现代科学研究证明,植物有"血型",有感情,有语言,有阴阳属性。植物是有灵性的。用植物布场,可以调节小气候,可以化解一些风水问题。无论在大自然界,还是在城市
21世纪,对地勘人力资源管理提出更高的要求。本文就地勘行业人力资源管理存在的问题与对策进行探讨。本文首先阐述了地勘行业人力资源管理存在的问题。其次,从广开入口,建立