一种基于开方检验的特征选择方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:IDYLL123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
开方检验是目前文本分类中一种常用的特征选择方法。该方法仅关注词语和类别间的关系,而没有考虑词与词之间的关联,因此选择出的特征集具有较大的冗余度。定义了词语的"剩余互信息"概念,提出了对开方检验的选择结果进行优化的方法。使用该方法可以得到既有很强表征性又有很高独立性的特征集。实验表明,该方法表现良好。
其他文献
为了解决手机取证系统难以提取手机应用的云端数据的问题,建立了手机仿真取证系统。手机仿真取证系统在专用取证设备上运行仿真器,模拟手机运行环境,运行并登录手机应用程序,进行
为获得兼具镁合金与其他金属优点的层状复合材料,按照Stivers,Wittman模型,计算动态参数,选取下限工艺,进行AZ31B镁合金与1060铝合金、5083铝合金、T2铜合金、TA2钛合金、S31
云计算提供了4种部署模型:公有云、私有云、社区云和混合云.通常,一个私有云中可用的资源是有限的,因此云用户不得不从公有云租用资源.这意味着云用户将会产生额外的费用.越来
提出了一种基于数学形态学的PCB自动缺陷检测算法。在对测试图像进行距离变换时,将参考图腐蚀后的边缘作为感兴趣区域使用,边缘上的每个点都具有线路边界的相应距离信息。对
现有的半监督聚类集成方法能利用先验信息,使集成的准确性、鲁棒性和稳定性得到提高,但在集成阶段加入成对约束信息时,只考虑了给定的约束信息而忽视了约束点与被约束点的邻
近年来,基于对等网络(Peer-to-Peer,P2P)的视频点播(Video-on-Demand,VoD)作为付费网络电视业务的一种新趋势受到了越来越多的关注,然而对等网络自身存在的不稳定性、异构性等缺
心理分析在侦查中应用得十分广泛与深入,特别是对犯罪现场痕迹的心理分析。电子数据作为证据意识已经深入人心,但作为个人心理侧面反映的电子数据,在心理分析方面研究甚少。电子
针对低功耗易失网络(Low-power and Lossy Networks,LLNs)中存储式RPL路由的大存储开销问题,提出了一种基于存储式RPL的改进型路由协议B-RPL.该协议充分利用了LLNs网络无线通信
在无线传感器与执行器网络中,可以通过调整剩余节点的位置来提高目标区域覆盖率,以更好地为sensor节点服务.提出了一种基于二分编码的网络移动覆盖算法(SMR算法).在每次搜索中,
闪存已经是目前使用最为广泛的存储设备。众所周知,闪存对访问模式具有极大的敏感性,比如随机与顺序访问模式、冷热访问模式以及写聚集和分段顺序写模式等。此外,闪存设备的