论文部分内容阅读
为了实现准确批量检测赌博网站,依据现阶段赌博网站的特点,区别于传统的赌博网站检测技术,以域名作为研究对象,对已有赌博网站下链接进行爬取,截取新增域名作为待分类数据,利用社区发现算法聚类新域名后,结合Page Rank算法获得的PR值排序,实现批量分类赌博网站和白名单网站,最终可实现单次批量获取60%以上赌博网站。