基于多因素方差分析的文本向量特征挖掘算法

来源 :科技通报 | 被引量 : 0次 | 上传用户:bxinliy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本向量特征挖掘应用于信息资源组织和管理领域,在大数据挖掘领域具有较大应用价值,传统算法精度不好.提出一种基于多因素方差分析的文本向量特征挖掘算法.使用多因素方差分析方法得到多种语料库的特征挖掘规律,结合蚁群算法,根据蚁群适应度概率正则训练迁移法则,得到种群进化最近时刻获得的数据集有效特征概率最大值,基于最优划分的K-means初始聚类中心选取算法,先对数据样本进行划分,然后根据样本分布特点来确定初始聚类中心,提高文本特征挖掘性能.仿真结果表明,该算法提高了文本向量特征的聚类效果,进而提高了特征挖掘性能,
其他文献
近年来,六西格玛管理在国内企业得到大力推广和发展,但在六西格玛人才培养上,企业多是以专业咨询公司辅导为主,忽视了企业内部员工对六西格玛教材的适应性。本文利用QFD工具,
针对吉藁生产的粘胶基白竹炭纤维进行了染色方面的逐步探讨,对粘胶纤维、白竹炭纤维及竹炭/棉混纺纱线(70/30)用B型活性染料染色,比较了白竹炭纤维与粘胶纤维染色性能的差异,并找出
随着经济的发展,人际交往的增多,肝炎病毒混合感染在人群中有上升的趋势。本文就我院1995年至1997年两年间收治的肝炎病毒混合感染78例作病原学分析。1临床资料11诊断标准:依照1995年5月在北京第
传感器是信息系统的源头,在某种程度上是决定系统特性和性能指标的关键部件。本文试图探讨现代传感器技术发展方向,从概念、原理、性能和应用等层面评述了9种传感器:光纤传感器
“图书漂流”听上去很有吸引力,也很时尚、浪漫,然而这种时尚的漂流方式在中国还太稚嫩,能真正普及这种漂流方式恐怕就更难了。本刊早在2004年3月上旬刊曾报道过题为“春风文艺
随着医学模式的转变,人们已开始关注社会及心理因素对分娩过程的影响,并由此出现了分娩时的心理护理治疗。为探讨心理护理治疗在产程中的作用,我院自1998年4月~1998年10月,对60例产妇进行心理治
目的了解北京市海淀区学院路周边市售油条样本中铝含量水平,检测其明矾使用情况及居民对油条中铝危害相关知识的知晓情况。方法对海淀区学院路周边4所高校食堂、5个流动摊位
记得二战时期,德国坦克从一座坚固的桥上轰隆隆开了过去,后面的几万名步兵为了显示威风,排好纵队,正步走上大桥,没想到坚固的大桥在德国兵整齐的脚步声中波动的越来越厉害,一声巨响
英国《独立报》撰文,《哈利·波特》系列小说的最后一本对小书商或许是个梦魇,甚至对该小说的出版公司布鲁姆斯伯里出版公司也一样。书店之所以要受难,是因为他们无法在这一