使用概念描述的中文短文本分类算法

来源 :计算机应用 | 被引量 : 7次 | 上传用户:fjiik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对短文本特征较少而导致使用传统文本分类算法进行分类效果并不理想的问题,提出了一种使用了概念描述的短文本分类算法,该方法首先构建出全局的语义概念词表;然后,使用概念词表分别对预测短文本和训练短文本概念化描述,使得预测短文本在训练集中找出拥有相似概念描述的训练短文本组合成预测长文本,同时将训练集内部的短文本也进行自组合形成训练长文本;最后,再使用传统的长文本分类算法进行分类。实验证明,该方法能够有效挖掘短文本内部隐含的语义信息,充分对短文本进行语义扩展,提高了短文本分类的准确度。
其他文献
在城区农村各随机抽取一个乡(街),分别在2~5岁、6~8岁、12~15岁、25~39岁组人群各抽取30人,采手指血用ELISA检测麻疹IgG抗体.结果城市人群麻疹抗体水平阳性率,GMT均高于农村,有极
浏览器隐私模式使得用户浏览行为的取证调查变得困难,相关证据只能来自于内存。提出一种获取活动进程内存空间的方法,通过使用目标进程的CR3寄存器的内容替换当前进程的CR3寄存器的内容,使当前进程可获取目标进程的页目录和页表等信息,进而访问并获取目标进程内存空间。相对于先对内存进行完整镜像再获取目标进程数据空间的方法,缩小了下一步对用户浏览行为进行分析所涉及的数据范围,获取进程内存空间数据的速度更快。该
因狗舔伤口导致狂犬病,临床症状典型、狂犬病毒抗原阳性.
目的:探讨宫颈糜烂患者的感染因素。方法:用聚合酶联反应(PCR)对658例女性有症状的宫颈糜烂者和106例无明显症状的宫颈光滑者进行NG、uu、CT检测。结果:宫颈糜烂患者NG、uu、CT
为了提高对等(P2P)文件共享系统的交易成功率,鼓励节点积极贡献自身资源,增加网络资源,促进网络良性持续发展,建立一种基于动态拓扑构造的激励机制。该激励机制可对网络节点行为进行有效激励,通过拓扑优化来促进网络公平和发展,保证了P2P共享文件系统的良性运行,提高了网络的性能。通过模拟仿真实验和分析表明,提出的基于节点可信度的信誉激励机制具有正确性、有效性等特点,与现有的信任模型相比,在安全性和简约性
在虚拟计算环境中,难以实时地监控与分配内存资源。针对以上问题,基于Xen虚拟计算环境,提出一种能够实时监控Xen虚拟机内存(VMM)使用情况的XMMC方法并进行了实现。所提方法运用Xen虚拟机提供的超级调用,其不仅能实时地监控虚拟机内存使用情况,而且能实时动态按需分配虚拟机内存。实验结果表明,XMMC方法对虚拟机应用程序造成的性能损失很小,低于5%;能够对客户虚拟机的内存资源占用情况进行实时的监测