基于PCA-Spectral-LDA的网络舆情聚类和情感演进分析:一个微博文本挖掘研究

来源 :系统科学与数学 | 被引量 : 0次 | 上传用户:lisson000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网成为网络舆情传播的主要媒介,分析突发事件的情感发展态势,可以探究舆情演变规律并识别潜在风险,为舆情的引导和控制提供决策支持.文章对爬取的微博文本数据进行预处理,基于文本数据的高维特征,首先利用主成分分析方法进行降维,然后采用谱聚类算法,并提出结合潜在狄利克雷分析模型提取文本主题的方法,对每类主题进行情感分析.通过数据可视化方法研究网民的情感倾向,得到网络舆情传播中情感的时空演化规律.研究结果能够清晰地表明网民的情感态度和舆情走向,文章的研究方法为微博舆情的研究提供了新视角.
其他文献
米曲霉作为一种重要的工业微生物,在异源蛋白表达方面已有广泛应用,受限于被表达蛋白的修饰及分泌过程,目前实际生产使用的基因供体主要局限于其他真菌,尤其是丝状真菌.当外源基因来源于植物、昆虫和哺乳动物时,米曲霉所生产的异源蛋白产量及生物活性往往不尽如人意.本文综述了米曲霉作为宿主表达异源蛋白的研究进展,包括其现有的遗传操作手段及异源表达方面的应用及探索,重点介绍了应用过程中面临的挑战和解决策略,另外,对米曲霉表达异源蛋白的应用前景及发展方向进行了展望.
[背景]单增李斯特菌为肉类及乳制品中常见的食源性致病菌,传统的培养法检测无法满足口岸大批量食品的快速检测要求,建立简便、灵敏、快速及现场可操作的技术至关重要.[目的]建立快速简便的荧光重组酶介导等温扩增(Recombinase-Aided Amplification,RAA)法检测单增李斯特菌,以适应口岸快速通关及监管的实际需求.[方法]根据单增李斯特菌hlyA基因保守区设计特异性引物、探针,通过引物两两组合结合探针筛选出扩增效率及灵敏度最佳的引物组合,优化反应温度及引物探针浓度,确定最佳反应条件.将建立
假设个体所面临的种内竞争环境随年龄而异,提出并分析一类结合空间扩散和个体年龄等级结构的种群模型,由非线性二阶偏微分积分方程描述.在合理的参数条件下,运用不动点方法和线性系统的相关结果确立了模型解的存在唯一性及非负有界性,导出了解的比较原则,分析了变量分离型解.所获成果一方面拓展了一些已有文献的工作,另一方面也为研究系统的稳定性、可控性和最优控制问题奠定基础.
社交媒体的出现深刻改变了人们的信息交流方式,为投资者提供了新的交流分析股票信息的途径.文章利用了文本分析的方法,度量了基于东方财富网股吧论坛的证券信息交流指标,研究社交媒体上的证券信息交流对股价同步性的影响.研究发现,基于社交媒体的证券信息交流能够显著降低股价同步性,并且在分析师关注度越低、信息不对称程度越高时,证券信息交流降低股价同步性的作用越显著;进一步地,在所有的发帖中,当证券信息交流的帖子占比越高时,引起投资者的关注度越高.以上结果在变更主要变量衡量方式、变换数据频度后依然稳健.文章研究进一步挖掘
在高维情形下,为了实现对期望收益率的更准确估计,提高投资组合策略的稳定性及获得更好的样本外表现,文章利用流通市值和账面市值比的双因子排序组合信息,在回归形式的均值-方差策略目标函数中引入了Group-LASSO (GLASSO)正则项,构建了GLASSO-MV投资组合策略.相比包含权重l1-范数正则项的LASSO-MV策略,GLASSO-MV能够有效利用因子组合之间的定价差异信息,从而输出组间的稀疏权重,进而更有效地估计高维投资组合权重并取得更好的样本外表现.为了获得合适的正则项参数和权重稀疏度,文章在5
电动货车的通行便利政策影响着其销售和使用.在其销售阶段,针对电动货车的新技术扩散特征及其与燃油货车的竞争性,将Bass模型和多项Logit模型嵌入系统动力学模型分析电动货车的推广规模.在其使用阶段,反映电动货车对“客改货车”出行的替代作用,分析电动货车通行便利政策下限行时段配送车辆出行量(治堵效果)和配送车辆NOx排放量(减排效果).以深圳市为例,提出四种方案仿真,包括维持当前通行便利,在此基础上电动货车通行更便利、燃油货车限行更严格和提高燃油货车报废率.结果 表明,电动货车通行便利政策能促进其推广,它对
传统理想解法存在与正理想解欧氏距离更近的方案同时与负理想解欧氏距离也更近的缺陷,现有投影方法存在无法完全度量向量之间的相近程度及投影值的取值范围无界限的缺陷.为了解决以上问题,文章提出了基于归一化双向投影法的动态评价方法.首先回顾了双向投影法的相关内容及投影方法存在的缺陷;然后讨论了归一化投影模型的定义及性质;在此基础上提出了基于归一化双向投影的评价方法并定义了衡量方案优劣的一致性系数,通过具体的例子与其他投影方法进行分析比较;最后加入时序数据拓展为动态评价模型,同时考虑指标值的差异性和增长程度,并通过对
生态补偿机制是我国将“绿水青山”转化为“金山银山”,实现生态产品价值的重要途径,是促进绿色发展和均衡发展的重要政策工具,但是生态补偿项目具有投资周期长、数额大、且经济政策不确定性高等特点.文章在充分考虑上述的特征后,运用实物期权理论,在生态效益流和生态补偿项目建设成本双重不确定的情况下,研究中央政府与地方政府对于生态补偿项目投资决策问题.首先,讨论地方政府的最佳投资时机和投资期权价值并分析了纵向转移补偿政策对地方政府积极进行生态补偿项目投资决策的影响;其次,根据地方政府的投资等待时间,推导中央政府对于生态
传统一阶网络模型难以捕捉节点间的间接依赖关系,高阶网络建模方法能有效提高模型对现实系统的表征精度.文章使用美国物理学会电子期刊数据库116年间的引文数据,在一阶网络的基础上,构建以文献引用关系为节点、以路径长度为2的引用关系为边的二阶引文网络,并进一步提出基于引用多样性信息熵的高阶网络表示信息增益指标.结果 表明,期刊Rev Mod Phys和Phys Rev Lett的二阶网络表示信息增益最大,这两种期刊的被引率受前序期刊的间接影响较大,且在一阶与二阶网络中相差最大达到0.38,说明应用二阶网络开展引文
将全球价值链分工(GVC)与国内价值链分工(NVC)结合为统一分析框架,编制医药制造业非竞争型投入产出表,在此基础上,依据医药制品科技属性改进价值链分工位置指数,以医疗器械制造业为例,对中国各省份医药制造业参与GVC和NVC分工程度和地位进行测度及比较研究.结果 表明:1)中国大部分省份医疗器械制造业NVC分工参与度高于GVC分工;2)中部和东北地区成为内循环的枢纽,中部地区的湖南,西部地区的宁夏,内蒙古和贵州等省份NVC分工前向参与活跃,东北地区的黑龙江和吉林NVC分工后向参与度排名靠前;3)长三角,珠