绿色网络网页正文内容提取算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:conanjunn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中的网页有较多商业广告,绿色网络系统无法过滤其中具有不良内容的网站。为解决该问题,提出一种绿色网络网页正文内容提取算法。通过文件对象模型树识别与提取网页正文内容模块,使用基于粒子群的权值优化算法对网页正文各个板块特征权值进行评分,利用与不良关键字的比较,确定并过滤不良网页。实验结果表明,经粒子群权值算法优化提取后,绿色网络系统对不良网页的识别准确率为86.9%,召回率为95.6%,F值为91.02%,比优化前有较大提高。
其他文献
目的探讨溶血样品胆碱酯酶(h-ChE)与未溶血样品胆碱酯酶(bl-ChE)活力值之间的关系.方法采用羟肟酸铁比色法测定济南地区112名健康人bl-ChE及h-ChE,并用血红蛋白(Hb)值对h-ChE
本文报道了对广州市内一些高档宾馆、大型商场和高档舞厅、卡拉OK厅的中央空调新风系统进行的调查,结果显示:新风系统设计欠完善,普遍忽视新风机房卫生管理等现象;新风量合格率较低
传统蚁群算法在解决数据仓库查询优化问题时存在过早收敛、收敛速度慢的缺点。为此,对传统蚁群算法进行改进,将伪随机状态转移规则引入最大最小蚁群系统,在每次迭代结束后进
提出一种基于能耗均衡的无线传感器网络多跳分簇路由算法。该算法依据能量因子参数和节点能耗比来优选簇首,采用基于复合距离的入簇方式和分簇规模约束机制管理普通节点,并采
<医院污水排放标准>(试行)GBJ48-83自1983年颁布实施以来,对管理监督各级各类医院污水和污泥的无害化排放起到了积极的作用.但是,随着经济、社会的发展,原标准中的一些内容已
目的建立脱毛霜(膏)类样品中氢氧化物的测定方法,为国家制订脱毛霜(膏)类样品中氢氧化物的检测方法提供依据.方法采用电位滴定法.结果方法的相对标准偏差均<1.61%,具有良好的
多径信号延迟估计与多径干扰抑制技术一直是卫星导航领域的一个研究热点。在分析近距离镜面多径信号时间延迟特性的基础上,提出一种基于无迹粒子滤波的多路径信号延迟估计方法。给出标准的粒子滤波算法模型,讨论无迹粒子滤波算法在多路径信号延迟估计中的应用,描述算法的推导过程。计算机模拟结果验证了该算法的有效性。
本文基于“7S”管理理念,浅析了整理、整顿、清扫、清洁、安全、节约及素养在手术室护理管理中的应用,并明确“7S”管理法在应用中的注意事项,提高手术室护理工作质量具有积极作
为探索中医脉象的形成与人体循环系统及血管生理参数之间的联系,在心血管双弹性腔模型基础上,借助Simulink仿真外周阻力、血管顺应性、血液流动惯性变化对脉波图时域特性的影响规律,并利用中医脉象模拟系统,通过改变血液粘度、血管弹性、外周阻力及取脉压力,实测和验证Simulink仿真结果,建立心血管生理参数与理论模型之间的联系。实验结果表明,血液粘度变化对外周血管阻力有一定影响,血管弹性与顺应性直接相
为了研究用于评价建筑装饰材料和室内产品卫生学品质等级的方法和方案,我们引进了国际上用于研究暴露剂量人体效应关系的最新技术:控制暴露人体实验(Controlledhumanexposureexperiment)。该实验是研究室内空气质