基于TF-IDF的网络地理文本信息分类研究

来源 :科学技术创新 | 被引量 : 2次 | 上传用户:aaajansen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量以文本形式描述的地理信息存在于互联网中,大量地理相关的网络化信息难以得到发掘。为有效提升文本信息中与地理相关文本类别精准度。针对特征矩阵对分类结果的影响,在文本预处理中加入地理类特征名词,提出基于地理名词的TF-IDF特征权重计算方法,并在向量空间模型中引用新的特征矩阵。实验结果表明,加入地理特征名词可以降低特征维度,新的特征矩阵可以优化分类结果。该方法更准确地分类出与地理相关文本信息。本实验只针对与地理相关的文本信息发现,并未对地理信息进一步分类。此方法具有一定的应用前景和实用价值,可在此基础
其他文献
<正>自1946年 Robert R Willson 提出高能质子束治疗肿瘤病人,到1955年美国加州(Berkeley)利用质子放射治疗第一例垂体瘤病人,已有50多年的历史。1985年成立了国际质子治疗组
会议
随着社会的不断进步和经济的快速发展,桥梁工程和道路建设也取得了长足的发展,人们在城市化进程不断加快之下对道路建设的需求量也越来越大,现有桥梁工程的稳固性和持久性已
随着全球生态环境恶化加剧,我国所面临的环境危机日益严重。为改善生态环境,给人们提供一个宜居的生态家园,我国在林业工程建设上加大了投入力度,以此来为改善生态环境,为建
汽车的普及,交通问题越来越被重视。十字路口的交通问题更是至关重要。文章介绍了一种基于数字电路的十字路口交通灯控制系统,并使用Proteus进行仿真,达到了交通灯的预期效果