TCBPL:一种高效文本分类新方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:zhuyanmei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据模式聚合理论(PA)和隐含语义分析理论(LSA)提出了一种文本分类新方法--TCBPL方法,该方法应用PA理论和LSA理论来构造向量空间模型,大大削减了特征向量的维数,同时增强了稀有词的作用,并在特征向量中引入了语义成分,从而提高了分类的速度和精度.
其他文献
介绍了一种基于联合得分的实时孤立词语音识别系统。在识别阶段,通过内插向最得到两种改进的DTW算法,并且和基本的DTW联合起来对语音进行识别,得出各自的识别结果,最后把所有的结
如何把握初中地理世界分区部分的教材结构和教学目标北京市教育局教研部钟作慈按照义务教育教学大纲的要求,初中地理世界分论部分有两个重要变化。一个变化是教学内容的编排,从
<正> 肺心病是冬季寒冷季节高发性心肺疾病。以呼吸困难、心悸、气急、紫绀、通气功能障碍、缺氧和二氧化碳潴留导致呼吸和心力衰竭为临床主要表现。临床治疗方法主要是休息
期刊
<正> 1985~1995年共收治急性心肌梗塞110例,其中误诊22例,误诊率20%,现分析如下。1 无疼组 本组7例,其中男性70岁以上2例,突发胸闷气短,呼吸困难,门诊以冠心病心率失常收住院。
<正> 出血性脑梗塞(HI)是指脑梗塞患者由于梗塞区血流再通导致继发性出血。自1990年至1994年遇见24例,现报道如下。一、临床资料 1.一般资料 男22例,女2例:年龄28~4O岁2例,43~4
以网站作为Web图的顶点,以网站之间链接为有向边,研究了中国境内Web图的拓扑特点和宏观结构.试验表明:网站的入度和出度分布同样服从幂级数定律(Power Law);境内Web图的连通
基于统计暴露攻出的原理,提出了在确定和不确定通信对象个数情况下的统计暴露攻击算法,分析了算法中的显著性因子对攻击有救性和攻击轮数的影响。在此基础上,提出了发送者掩护和
变色龙签名是一种非交互的数字签名,基于“先哈希后签名”的范式。其中使用的哈希函数是一种特殊的陷门单向哈希函数——变色龙哈希。变色龙签名与普通数字签名的不同之处在于
【正】 科学的制定化学教学目标,是实施单元达标教学的首要环节和基本保证。而化学教学目标参照系,既是编制明确、具体、可测的单元或课时教学目标的前提的参照样本,也是编制
提到血糖检测,不少人第一反应是取指血。对需要经常检测血糖水平的人来说,每天多次取指血是痛苦过程。如今,美国研究人员正在研究用眼泪测血糖的方法,希望有一天能代替血液检测。