新浪微博数据挖掘方案研究

来源 :第四届信息安全漏洞分析与风险评估大会 | 被引量 : 0次 | 上传用户:leiweiwei42
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着新浪微博用户群体的增长,基于新浪微博数据的分析已经引起了社会的广泛关注,其中新浪微博的数据获取是微博研究首先需要解决的问题。本文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试,通过两套方案的结合可以实现新浪微博数据高效全面的获取。
其他文献
  中华通信系统有限责任公司一直以来充分发挥国企的综合优势,创建自主优势产业,为适应“十二五”期间的新形势,中华通信将进一步优化空间谱估计测向技术,扩展监测测向接收机的
  文章给出TD-LTE室内分布模型的总体要求,结合实际布网的不同场景,反推出不同条件下TD-LTE室内分布天线覆盖功率的匹配需求,并与其它系统进行对比分析。容量模型结合VolP和不
  文章对TD-LTE引入后的终端驻留策略、空闲态重选、数据业务互操作及话音业务互操作方案进行了分析和研究,提出了面向TD-LTE商用网络的TD-LTE/TD-SCMDA/2G互操作建议和TD-L
  对于大型发电机来说,运行中不可避免的会存在某种不对称状态,此时定子电流中就会含有一定的负序电流分量,进而在水轮发电机阻尼绕组内产生额外的损耗和发热。随着水轮发电机
  大型汽轮发电机定子线圈的内屏蔽技术是近些年来绝缘结构优化没计所提出的一种重要方法。本文基于有限元软件ANSYS,采用2维有限元方法对1000MW级汽轮发电机定子绕组线棒使
  负序电流对水轮发电机所造成的危害已经在电力系统的运行实践中被多次证实。而随着水轮发电机单机容量的不断增加,负序电流对发电机所产生的损害也随之增大。因此对于大型
  本文论述了为自动火灾报警系统正常运行所需进行的定期维护、试验、保养工作,同时对系统维护保养的方式方法和易发故障及处理方法进行了阐述,对自动火灾报警系统的维护保养
  在行波故障测距法中,对准确提取行渡波前到达时刻的信号处理方法的研究一直是重点和难点。本文提出一种基于提取故障线路自然频率的单端测距新方法。在输电线上传播的行波
  本文对当前物联网在智能电网中的应用前景及面临问题进行了阐述。首先简要介绍了物联网及智能电网的基本概念,说明了二者之间的关系,然后从用电、巡检、状态监测、调度四方
  噪声干扰抑制是发电机局部放电在线监测需要解决的关键问题之一。在各类噪声干扰中,随机脉冲干扰由于其时域和频域特性都与局部放电信号十分相似,是最难抑制的一类干扰。本