改进的基尼指数在文本分类中的应用研究

来源 :长沙大学学报 | 被引量 : 0次 | 上传用户：forestdancer

【摘要】

：

随着网上信息的极大丰富,文本分类技术显得越发重要,且预处理技术已成为文本分类的瓶颈.在预处理中采用TF-IDF算法,并且根据基尼指数的纯度原理对传统的基尼指数方法进行了基

【作者】

：

唐伟刘丰年陈崇帮欧新良王苏

【机构】

：

湖南工业大学计算机与通信学院,长沙大学计算机科学与技术系

【出处】

：

长沙大学学报

【发表日期】

：

2013年5期

【关键词】

：

文本分类 TF-IDF算法基尼指数测度函数纯度原理 text categorization TF - IDF algorithm Gini coeff

【基金项目】

：

湖南省自然科学基金（批准号：11JJ3002）资助项目,湖南省教育厅科技重点项目（批准号：09A010）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网上信息的极大丰富,文本分类技术显得越发重要,且预处理技术已成为文本分类的瓶颈.在预处理中采用TF-IDF算法,并且根据基尼指数的纯度原理对传统的基尼指数方法进行了基尼指数测度函数的改进,以降低原始文本的特征选择空间的维数.通过对比实验数据,表明这种改进是可行且有效的,体现在时间、空间复杂度小,精确度高.

其他文献

生物质压块成型技术应用

生物质一直是人类赖以生存的重要能源，在整个能源中占有重要地位，生物质资源主要来源于农作物秸秆和林业废弃物。目前在世界能源消耗中，生物质消耗占世界总能源的14％，仅次于石油、

期刊

生物质压块技术应用

交通肇事被害人救助机制构建

通过对交通肇事被害人救助问题的调查研究,发现近年来理论界借鉴国外比较成熟的刑事被害人救助经验,开始探索我国刑事被害人救助的构建,司法机关和地方立法机关更是对此进行

期刊

交通肇事专项机构精神救助traffic offences special agencies mental relief

安徽省高职院校工匠型人才培养困境及对策

工匠精神作为中华民族的传统美德,对于社会的进步和发展起到了十分重要的作用。高职院校应当充分认识工匠型人才的重要性,并在实际的教学过程中加强工匠型人才的培养。然而,

期刊

高职院校工匠精神工匠型人才higher vocational collegesartisan spiritartisan talents

丹阳市农作物种子生产经营市场发展现状及管理对策

为繁荣种子市场,规范种子生产和经营秩序,通过对丹阳市种子市场现状的调查和分析,针对目前该市种子生产和经营中存在的问题,提出了相应的对策。

期刊

种子市场发展现状对策

论刑法干预市场经济之市民刑法观——以经济犯罪的刑事审判为视角

市民刑法观要求刑法对市场经济的干预既要维护国家的市场经济秩序，更要强调保障公民的人权与经济权利。在经济犯罪案件的刑事审判过程中，应牢固树立和坚持市民刑法观，依靠刑事法

期刊

国家刑法市民刑法民权刑法经济刑法刑事审判national criminal law criminal law for citizens crimi

改进的基尼指数在文本分类中的应用研究

其他学术论文