融合距离度量和高斯混合模型的中文词义归纳模型

来源 :计算机科学 | 被引量 : 0次 | 上传用户:jackyray
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词义归纳是解决词义知识获取的重要研究课题,利用聚类算法对词义进行归纳分析是目前最广泛采用的方法。通过比较K-Means聚类算法和EM聚类算法在各自词义归纳模型上的优势,提出一种新的融合距离度量和高斯混合模型的聚类算法,以期利用两种聚类算法分别在距离度量和数据分布计算上的优势,挖掘数据的几何特性和正态分布信息在词义聚类分析中的作用,从而提高词义归纳模型的性能。实验结果表明,所提混合聚类算法对于改进词义归纳模型的性能是十分有效的。
其他文献
介绍了几种有机硅卫生整理剂的合成技术路线及工艺流程。并从有机硅卫生整理剂的化学结构、性能阐述了灭菌原理。
公共交通工具,尤其是公交车服务,可以减少私家车的使用和燃油消耗,缓解交通拥堵和环境污染状况。当乘坐公交车时,乘客不仅关心等车时间,更在乎公交车的拥挤程度,过度拥挤的公
为了降低计算成本并节约系统功耗,信号处理最新出现的理论-分布式压缩感知(Distributed Compressed Sensing,DCS)成为视频技术的应用焦点。为此,一种基于多假设预测的视频DCS(VDCS)方案被提出。在VDCS的解码端,当前帧的预测来自于以前重构的参考帧(CS帧),而残差作为重构条件用于改善视频的重构质量。实验结果表明,提出的残差-预测VDCS方法重构视频信号的峰值信噪比
本文阐述了禁用染料的范围和染料中含有致癌芳香胺的原因分析,指出用环保型染料取代禁用染料是当前染料工业发展的主攻方向。
维罗绒织物系涤纶经编起毛织物,结构致密,绒毛短,纤度细。本文具体阐述了维罗绒织物的印花工艺过程及工艺条件;为改善印花效果,对各关键工序的操作提出了注意事项。
随着多级单元(Multi一Level Cell,MLC)闪存存储密度的增加,单元间干扰(Cell一to一Cell Interference,CCI)成为影响NAND闪存可靠性的主要噪声。在深入研究MLC闪存模型和CCI噪声模
为了更高效地实现科学工作流任务的调度,研究了云环境中的工作流调度多目标优化问题,提出了一种基于非占优排序的混合多目标粒子群优化的工作流调度算法HPSO。首先,建立了截
对于大型系统,为确保其运行的可靠性、稳定性及高效性,需要从两个方面对系统进行验证:业务模型和系统模型。目前,对业务模型的验证可通过BPMN来完成;对系统模型的验证可通过SP
中心动脉压的临床医学意义虽大于传统肱动脉和桡动脉血压,但其推算方法一直以来受基于有创伤数据的通用转换函数(General Transform Function,GTF)的建立和桡动脉脉搏波中隐蔽