一种基于模糊VSM和神经网络的文本分类方法

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:felixjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本自动分类时可能存在一个文本属于多类的问题,提出了一种基于模糊向量空间模型和神经网络的文本自动分类方法。该方法采用模糊集理论,把特征项在文档中出现的位置作为反映文档主题的重要程度(隶属度),并在特征提取时充分考虑该位置信息,从而构造出模糊特征向量,使文本分类更接近手工分类方法。建立的网络由输入层、隐含层和输出层组成,其中输入层完成分类样本的输入,隐含层提取输入样本所隐含的模式特征,输出层用于输出分类结果。实验部分以万方数据库中部分文档数据为例验证了该方法的有效性。
其他文献
【正】实行企业改制,建立现代企业制度,没有现成的模式可循.我市在改革实践中,摸索出不少新的办法和路子,较好地解决了企业改革中一系列问题.
【正】皮革工业是浙江省的一个优势行业,具有广阔的市场潜力和发展前景.
【正】莆田县工艺一厂创办于1955年,从五十年代誉满八闽的木雕砚照花鸟,到六十年代名噪一时的象牙组雕精品,可谓一度辉煌.然而,“十年文革”却使雕塑行业停滞沉寂,而今的20年
对高弹涤纶印花针织物的水洗加工进行了分析研究,对比不同水洗工艺对布面风格、沾色情况、色牢度的影响,优选了水洗工艺。结果表明,高弹涤纶印花针织物的水洗可采用低张力式连续
人到中年,怀旧之情时常萌生.我没有辉煌的历史,也没有离奇的经历,一切平平淡淡,如过眼云烟,匆匆流逝.只童年的一处乐园,让我时时回味.我家旁边有条水渠,自出山不到五里的地方
<正> 在教学中培养学生的创新精神,提高学生的创新能力,造就创新型人才,是课改的新主题。英语创新教育的实施,应从以下四方面入手。一、教学中应处理好的三个关系要实施英语
调查数据显示,中学生获取性知识的主要途径来自书籍、杂志以及小伙伴,11.2%的男生和3%的女生承认曾经从黄色书籍和光盘中获取有关性信息.到了21世纪,我们的青少年还要从黄色
通过对特早熟肉扁豆生物特性的观察,该品种从鲜荚的外观、口感、品质、产量等反映良好.同时与特早熟湘扁1号、湘扁2号比较,鲜荚肉质厚,其产量3500~4000 kg/667m2,鲜荚上市比常
【正】改革开放以来,我国中小企业取得了巨大的发展,这对于我国市场经济体制的完善,国民经济的持续、稳定、快速发展都起到了巨大的促进作用.尤其是在当前,为了缓解日益严峻
【正】在上海众多的中小企业中,集体所有制企业占有很大的比重.以中小企业中占绝对多数的小企业为例,根据本市工业系统96年统计资料,本市工业小企业为14605户,其中集体企业77