基于边界可信度相似的快速文本分类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:niitliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
类别的中心和边界是类别的重要特征.利用训练样本的中心和边界作为分类准则,提出了一种基于边界可信度相似的快速文本分类算法。通过类别边界可信度调整文本与类别的相似性,克服了数据集类别间样本分布不均衡和类别中样本密度不均的缺点,提高了分类性能。实验结果表明该算法提高了文本分类的效果,显示出了较好的鲁棒性,并显著提高了文本分类效率。
其他文献
提出了一种可控制形状的多边形变形算法。该方法在源和目标多边形上指定对应的特征点,通过特征点的位置变化来带动整个多边形变化。得到的中间多边形在特征点约束下保持原内在量相对关系的最小变化,有效去除了多余的形变。通过试验表明,该算法产生的变形序列能很好地避免萎缩、自交等不自然现象,取得了良好的变形效果。
为了验证椭球坐标及球坐标下的单次散射非共面模型的正确性,本文首先采取当发射偏轴角及接收偏轴角为零时这两种模型应该退化为共面模型而与单次散射共面模型进行对比。其次,
通过车辙试验,分析不同沥青用量下的车辙指标。在不同沥青用量的试验均符合动稳定度要求的条件下,追究其车辙深度,得出最佳沥青用量,并用马歇尔试验来检验沥青用量是否符合标
解释了过度包装的概念,分析了过度包装的成本及其危害,提出了治理过度包装的对策及建议。
基于对当下大学生阅读状况的分析,指出当前大学生人文素质教育的必要性及现状,指出高校图书馆人文素质教育的优势,并提出高校图书馆应对人文素质教育的策略。
为了探讨某一类型空时码的最大似然检测的迭代算法.给出了这类码基于冗余线性预编码的通用构架,包括许多空时码算法示例.用这些码的特殊线性结构导了出在估计参数和检测发送
Experimental results showed that energetic ion induced phase change in a solid could be achieved not only by irradiation at high fluences but also by singe ion
针对目前DHT系统较高的维护开销、应用层网络与物理网络的拓扑失配等不足,提出一种基于分层DHT的拓扑感知流媒体体系TA-chord2。分层的设计使节点根据其服务能力对系统做出相