信息熵方法及在中文问题分类中的应用

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ajie830510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文问题分类方法中布尔模型提取特征信息损失较大的问题,提出了一种新的特征权重计算方法。在提取问题特征时,通过把信息熵算法和医院本体概念模型结合在一起,进行问题的特征模型计算,在此基础上使用支持向量机方法进行中文问题分类。在城域医院问答系统的中文问题集上进行实验,证明了该方法的有效性,大类准确率及小类准确率分别达到89.0%和87.1%,取得了较好的效果。
其他文献
本文提出了一种基于时域加权的非叠代优化算法,用于重构经过采样示波器测量的阶跃信号、脉冲信号等.该算法基于一个期望误差函数,经计算与真实误差很接近,并使用时域加权来优
在复杂网络的理论基础上,基于节点度和最小支撑聚类构造了一个阻抗函数,利用该阻抗函数提出了一种可应用于城市路网的启发式路径搜索算法,该算法搜索到的路径可以在总路径长度接
提出了一种无线传感器网络最大生命期和最大流路由算法,证明了网络最大生命期相当于获得网络最大流,根据最大流最小割定理,网络一定存在一个可行解满足网络最大流,在算法复杂度较
恢复真空计量学天平的研制黄锦才(中国测试技术研究院,成都610061)1前言真空计量学天平(以下简称真空天平)是我国建立国家干克基准和传递质量量值的关键设备。它被列为我国1963-1972年十年科学技术
本文介绍了渐开线钩齿花键齿厚的测量方法,从理论上了齿厚测量在实际操作中的特点及注意的问题,具有重要的参考价值。
本文基于双光栅法测量准直性原理,在550mm的平行光管上完成了一系列的实验研究,相对测量精度达到0.036%,并对误差源及提高测量精度的方法作了一定的分析。
本文介绍了频率稳定时域测量中最基本的一种方法,即频差倍增法,并详细分析了测量不确定度的来源及其算法。
随着IT外包服务业务的不断增长,IT外包服务中知识转移所导致的风险问题也愈加突出,如何规避IT外包中的风险问题也显得尤为重要。从知识分类的角度出发,利用粗糙集理论,对IT外
准确地提取荔枝果实的完整轮廓对采摘机器人自动识别与采摘至关重要。以蚁群和模糊C均值(FCM)聚类为理论基础,选用符合荔枝颜色特性的L*a*b*颜色空间,提出一种基于蚁群和带空间约束FCM的荔枝图像分割算法。该算法利用L*a*b*颜色空间的a*通道正轴代表红色和负轴代表绿颜色进行初始分割,然后利用蚁群聚类算法全局性和鲁棒性的优点确定FCM的聚类中心,用引入空间约束的FCM完整地分割出荔枝果实。实验结
针对大空间中红外视频火灾图像边缘模糊,不易准确分割问题,研究了一种基于背景差分和C-V模型的分割方法。通过背景差分得到运动图像;利用形态学处理得到完整的运动区域,并获得其外接矩形;以外接矩形作为C-V模型的初始轮廓曲线进行分割,得到封闭、完整的运动目标轮廓。该算法避免了对整幅图像分割,减少了运算量。通过实验仿真并与阈值分割算法比较,证明了该算法的准确性和有效性,有利于下一步火灾特征提取与识别。