基于文本内容分析的微博广告过滤模型研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户：ktzgy

【摘要】

：

针对新浪、腾讯等微博平台出现大量广告的问题，提出一个微博广告过滤模型。通过对数据的预处理，将采集到的微博原始数据转换成干净且计算机易处理的数据。在预处理阶段，根据微博

【作者】

：

高俊波梅波

【机构】

：

上海海事大学信息工程学院

【出处】

：

计算机工程

【发表日期】

：

2014年5期

【关键词】

：

微博文本处理向量空间模型支持向量机文本分类广告过滤 microblog text processing vector space model Supp

【基金项目】

：

上海海事大学科研基金资助项目（20100093）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对新浪、腾讯等微博平台出现大量广告的问题，提出一个微博广告过滤模型。通过对数据的预处理，将采集到的微博原始数据转换成干净且计算机易处理的数据。在预处理阶段，根据微博文本的特点，对停用词表进行改进，以提高查准率，然后基于支持向量机构建一个训练分类器对数据进行训练，经过不断的学习和反馈，取得较好的分类效果。实验结果表明，该模型进行广告过滤时准确率超过90%，效果优于基于关键字的方法。

其他文献

基于CUDA的AES并行算法优化

为提升高级加密标准（AES）的加密性能,利用显卡的通用计算能力,在统一计算设备架构（CUDA）平台上实现AES的128位、192位和256位3个版本的GPU并行算法,并提出优化的AES并行算法。在

期刊

分块经验数据并行算法优化高级加密标准统一计算设备架构block experiential data parallel alogorithm opti

自然场景下基于边界先验的图像显著性检测

为了对自然场景中的显著目标进行准确检测,提出一种基于边界先验的图像显著性检测方法。采用简单线性迭代聚类的超像素分割算法将图像分割为颜色和纹理具有一致性的超像素,根

期刊

超像素分割边界先验空间显著性显著性检测背景区域superpixel segmentation boundary prior spatial salie

基于文本内容分析的微博广告过滤模型研究

其他学术论文