Web文本分类中特征选择的研究

来源 :山东轻工业学院学报:自然科学版 | 被引量 : 0次 | 上传用户:fengye1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web文本分类是Web文本挖掘的一个重要研究领域。Web文本分类中通常采用向量空间模型(VSM)来表达文本特征,但是所产生的维数是巨大的,从而导致处理过程非常复杂,所以需要先对文本特征进行合理的降维处理。本文对常见的特征选择算法进行了介绍,并对它们进行了比较,最后结合当前的研究成果分析特征选择的发展趋势。
其他文献
利用溶剂法提取长春碱,并通过柱色谱法进一步纯化长春碱,采用正交试验法优化其工艺,通过紫外分光光度法检测其相对含量,结果显示利用溶剂法提取的长春花生物碱含量高,效果好
一实验室的主要发展方向立足于计算机软件新技术开发和发展的前沿,敏锐把握专业领域的新趋势和新方向。关注流程制造企业的重大需求,以提供具有针对性的技术服务为工作导向,把基
本文通过2008—2015年公司债券非平衡面板数据探究货币政策如何影响公司债券信用价差。通过理论与实证分析得出:(1)货币政策对公司债券信用价差存在正反两个方向的影响。(2)
寻求中立型微分方程解的表达式是较困难的,虽有步长法,但是求解中立型微分方程解的表达式方面,至今没有很好的结果。本方用待定系数法讨论了方程:a(t-τ)+b(t)+c(t-τ)
目的探讨风险管理模式在护理管理中的应用效果。方法对该院2014年1月—2015年12月间医院护理管理状况进行回顾性分析,该院在2014年1—12月间实施常规护理管理,在2015年1—12
近年来,我国商业银行不良贷款率升高,信贷投放面临着行业和客户的选择困难.但是,现阶段我国仍 缺乏关于行业资金投放的理论和方法.本文利用复杂网络的方法研究经济系统中行业
基于资源禀赋、产业结构和地理位置等原因,我国经济发展呈现出明显的区域特征,西部地区资金人才匮乏,基础设施落后,是我国经济欠发达和最需要加强开发的地区,中央财政的转移
不同条件下进行啤酒发酵实验并测定发酵产生的SO2及H2S,发现不同菌株发酵产生的硫化物量有明显差别,不同麦汁初始pH值、麦汁中氨基酸、盐类含量对啤酒发酵中硫化物产量均有不同
【正】报载:当许多商家纷纷在服务上拿出新的“招数”来吸引消费者时,位于西安东大街繁华商业区的伟志商场却推出了一项新的“你穿我洗”服务内容:该商场售出的伟志西服,顾客