结合词语分布信息的TFIDF关键词抽取方法研究

来源 :中原工学院学报 | 被引量 : 0次 | 上传用户:kuibugo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了关键词抽取的相关工作,并对基于TFIDF的关键词抽取算法进行了分析。结合词语在文本中的分布均衡程度和首次出现位置等特征,提出了一种改进的TFIDF算法,并给出了相应的计算公式。在文档数量和文档平均长度不同的3个语料上进行了对比实验。实验结果表明,结合词语分布信息的TFIDF关键词抽取方法是可行和有效的。
其他文献
在设计H∞回路成形控制器并将其应用于网络温度控制系统时,权函数参数的选择十分关键。但在寻找满足设计要求的权函数参数过程中,用传统的人工蜂群算法会出现收敛速度过慢、
我国从2000年开始步入老龄化社会,而且老龄化程度正在加剧,由此带来的养老问题更显迫切与现实。尤其是计划生育政策实施以来,失独老人这类特殊人群的养老问题需要引起高度重
计算机大容量硬盘及大数据的海量内容导致硬盘存储的信息越来越多,这给数据挖掘、敏感信息发现等技术提出了新的挑战。针对这一问题,本文基于当前计算机普遍采用的多核CPU处
研究了不同热处理工艺对合成TizSnC材料的影响,并利用x射线衍射仪测定了合成产物的物相组成,通过扫描电镜观察其显微形貌.研究表明:以2Ti/Sn/C和Ti/Sn/TiC粉体为原料,采用传统热处理技