基于回归分析的网络恐怖信息主题爬虫

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:snrgw91924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的 /意义]针对目前从开源网络信息中采集网络恐怖信息难、采集效率低的问题,提出一种回归分析法,以综合语义相关与网页重要性两个因素,从而提高网络恐怖信息的采集效率。[方法/过程]通过分析、比较主题爬虫的特性,结合网络恐怖信息的特点,找出PageRank算法和TF-IDF算法中适用于恐怖信息采集的优点,并结合回归分析法,将恐怖信息的采集策略进行相关度预测,用预测结果反馈调节信息的采集过程。[结果/结论]网络恐怖信息采集要兼顾采集的数量和质量,在传统主题爬虫算法的基础上进行改进,提出针对于开源网络恐怖信息采集的爬虫优化算法,可以提高信息采集效率。
其他文献
大型企业内部往往存在数据孤岛问题,如何保证数据的提取和融合是企业信息化建设中的一大难题。中间数据库接口是一种解决方案。本文阐述了SAP系统与久其CI报表平台之间利用中
当前是我国推动煤炭行业改革与转型升级的关键时期,众多的改革措施虽然成为了煤炭行业走向光明的指南针,但也为煤炭企业的资金利用效率提出了更高要求。本文基于相关文献综述
由于科学家首次直接在硅片上制造出纳米级激光器,人们向将激光器和电子设备整合的艰难目标迈进了一步。这些微小的激光器是用化合物半导体制造的。这些半导体能以远胜硅片的
使用分子动力学和 Tersoff-brenner 多体势,模拟计算单壁碳纳米管的杨氏模量。所计算的单壁碳纳米管的杨氏模量的平均值为704.5 GPa,计算结果与实验值吻合。
通过构建区域火灾风险评估指标体系,利用GIS的空间分析功能对福清市中心城区火灾风险影响因子进行评估,并结合各因子权重,对所有风险因子进行叠加分析,得到城市火灾风险等级
<正> 该文刊登于《水利学报》1991年第7期,作者是北京农业工程大学郑耀泉和水利部农村水利水土保持司宁堆虎。考虑到滴头制造偏差和水力学变差是影响滴灌均匀度的两个主要因
随着互联网的快速发展,网络购物群体占比剧增;在网购方式为消费者带来便捷的同时,也加重了买卖双方之间的信息不对称。作为解决信息不对称的有效手段之一,在线评论使得消费者
通过2种常用化肥对固氮鱼腥藻(Anabaena azoticaLey),球胞鱼腥藻(Anabaena sphaericaBorn),多变鱼腥藻(Anabaena variabilioKutzing)影响的研究。结果表明,尿素和碳酸氢铵在
本文根据1994年举行的第10届国际激光与电光会议与国际量子电子学会议上有关激光器发展的报告综合而成。
本文从借助SPOC线上教学提升学习兴趣,以此提高学生的课堂参与率;借助校戏曲社团资源,增加课堂体验;借助越剧德育资源,融入课程思政等方面对地方高校戏曲通识课进行了教学探