【摘 要】
:
面对信息社会中老年人对养老信息的关注与需求,本文使用基于Python的网络爬虫技术对民政部网站的新闻和公文进行抓取。针对门户网站的新闻特点,对数据抓取过程以及训练集进行优
【机 构】
:
合肥工业大学工业与装备技术研究院,安徽省经济信息中心
论文部分内容阅读
面对信息社会中老年人对养老信息的关注与需求,本文使用基于Python的网络爬虫技术对民政部网站的新闻和公文进行抓取。针对门户网站的新闻特点,对数据抓取过程以及训练集进行优化,使用AdaBoost算法对给定的文本集合进行训练,得到筛选模型。提供一种有效的特征选择方法,采用χ2统计量准则,有效降低了特征维数,然后用该模型对采集的信息进行筛选得到养老信息。最后,对信息筛选结果进行了分析。实验分析结果表明,本文提出的方法可以实现对养老信息的有效筛选,在应用上可以满足老年人对养老信息的获取需求。
其他文献
针对水利水电工程建筑渗透问题,从引发建筑渗透的原因方面进行分析,提出混凝土防渗墙施工技术的应用要点,并且对该技术在混凝土防渗墙施工中的具体应用,做了简单的论述。混凝
采用Eulerian-Lagrangian法对100t钢包吹氩过程进行模拟计算,对不同吹氩流量下的钢包流场、气泡运动、液面形态和夹杂物去除进行了数学计算。优化结果表明,在当前的钢包条件
目的了解在校大学生的抑郁、焦虑现状,并探讨社会阶层背景的几个指标对在校大学生抑郁、焦虑问题的影响,为在校大学生心理健康教育工作提供科学依据。方法采取整群抽样的方法
本文讨论战国楚竹书中"是"字的用法,并就与系词"是"有关的材料和问题予以辨析。本文的基本观点是:楚竹书中的"是"字不是系词,相关文句不是判断句。
现在,张炜的长篇小说《丑行或浪漫》摆在我们面前。如何解读这部文本,在这个问题上,我们之间似乎存在着一定的分歧,而这个分歧恰恰是你我在现代文学、文学语言的理解上的分歧。所
我们正处在一个权利平等的社会,公平的诉求在社会的每一个领域都得到了越来越多的体现。在这种背景之下,权利的平等性就成为判断一种具体制度是否合理的基本标准。教育优惠作
【正】 在这篇文章里,我想谈三个问题:(一)“异化”这一概念的提出和发展;(二)异化理论是不是马克思成熟的思想;(三)异化理论与美学有无关系,有什么样的关系。
通过180t转炉双渣留渣工业试验,在高磷铁水条件下,研究了温度和渣中TFe的变化、尤其是较宽范围内碱度的变化对磷分配比LP、脱磷率以及倒渣时间的影响,并对脱磷渣进行了物相分
<正>痔是临床最常见的直肠肛管良性疾病,在我国肛门直肠疾病中,痔的发病率约占80.6%[1]。目前,手术仍是治疗痔病的最主要、最有效的手段。肛门肛管直肠的手术创口是一种易于