面向SNS的社会网络数据抓取与经验性分析

被引量 : 0次 | 上传用户:hhbsoftware
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着万维网的迅速发展,蕴含的社会网络数据迅速膨胀,其结构异常复杂,人们很难通过数字、表格或文字的方式对没有进行处理的海量数据进行分析、表示和管理,社会网络所包含的丰富信息资源难以被发现和有效利用。本论文对照片共享网站Flickr进行结构考察、抓取社会网络用户关系数据集,并对抓取的社会网络数据集进行出入度分析,在SQL Server 2005数据库管理平台上,通过SQL编程对社会网络数据集进行了压缩,再以给定用户作为中心节点提取周边的局部社会网络,并根据局部社会网络中用户节点度数选取关键的网络节点,通过查找最短路径将中心节点与关键节点连接起来,最终得到了三个矩阵形式表示的关键社会网络,设计了按照“同心圆”的模式围绕中心节点对关键社会网络进行了初始布点的相关算法,并基于Matlab平台设计和实现了布点算法,对提取的关键网络结构进行了可视化展示。通过对社会网络数据集的研究,本文得出社交网络Flickr具有复杂网络的无标度特征,并提出了基于SQL编程的社会网络数据集压缩方案,此方案提高了社会网络数据集压缩的效率。
其他文献
20世纪70年代著名历史地理学家史念海先生发表《秦直道遗迹的探索》一文(载《文物》1975年第10期),从此而始关于直道的考察与研究从未中断,特别是近些年来随着我国文化、旅游
森林资源不仅为社会提供有形的物质产品(如木材、非木林产品等),同时也向社会提供良好的环境服务(如涵养水源、保育土壤、保护生物多样性等)。人们已经越来越意识到森林资源
作为信息的载体,新闻已成为现代生活中不可或缺的一部分,它的重要性使人们意识到研究新闻的必要性。在过去的几十年里,国内外学者展开大量工作,总结、归纳英语新闻报道中主位
人类在创造物质财富和物质文明的同时,对地球资源环境的破坏也逐日增加。由于受到人口基数大,能源结构不合理以及逐步加速的工业化进程等因素的影响,环境和资源承载着超乎寻
航运事业的发展使航程时间缩短,货物交付速度加快,由此产生了大量的无单放货问题,这也是困扰着国际海运界很多年的一大难题。《鹿特丹规则》的出现为解决这一问题提供了新的
如俞宣孟的《本体论研究》所示,传统是论是传统西方哲学的核心。由于这个严密、紧凑的范畴体系遗忘了“是”,所以海德格尔重提了“是”的问题,且以基础是论取代了传统是论;随
研究背景与目的中药藤黄(Gamboge)系藤黄科植物藤黄树(Garcinia hanburyi Hook. F. G)所分泌出的干燥树脂,近年来,其抗肿瘤作用受到高度关注。已经有研究表明,新藤黄酸(neoga
光武中兴,改都洛阳,魏晋相禅,又皆以洛阳为帝都。在这300余年的历史长河中,洛阳不仅是东汉、曹魏及西晋王朝统治区域内的政治、经济及文化中心,也是中原王朝与周边民族及域外
典故词语是一种特殊的语言单位,它存在于世界上的各种语言中,在人们的日常交际中发挥着重要作用。本文将通过对俄语典故词语文化语义研究,分析俄语典故词语蕴藏的丰富文化内
食品安全已成为世界范围内广泛关注的问题,理想的食品质量控制模式是“从农田到餐桌”的全过程质量控制。食品安全追溯系统提供了“从农田到餐桌”的追溯模式,建立了食品安全