论文部分内容阅读
随着社会的不断发展,互联网在人们的生活中得到了更加广泛的应用,其已从简单的信息共享平台得到了飞速的发展,成为了一个巨大的关系网络,也就是是我们非常熟悉的社交网络。在现代人的生活中,社交网络所扮演的角色非常的重要,在信息获取上发挥了重要的作用,同时也是一个营销推广以及展现自我的一个非常重要的平台。作为一个主要的社交媒体,微博在这个过程中发挥了非常重要的作用,使得互联网用户的身份发生了转变,从最初的被动接收信息内容演变为主动搜索及发布内容,使得社会逐渐的进入到了一个网络社交的时代。但是随着微信内容量的井喷式上涨,只是将其按时间进行排序已经是不能够真正的满足客户的需求。在过去的微博排序结果中,使用者只能通过逐个查看每条内容才能找到自己关注的信息,不仅浪费了时间也是非常繁琐。因此,非常需要一个新的排序方法,此方法能够对用户各个方面的信息进行有效的挖掘以及整合,使得用户能够得到需要的内容,不仅如此,还能够帮助微博博主主动将合适的内容推送给对此类内容更加关注的用户。在论文中,主要是有如下的工作:基于Page Rank算法实现大规模网络节点重要性计算,从而分析得到微博用户的重要性。采用自然语言理解相关技术,对微博重要性分析算法进行了研究。基于社交网络结构、内容理解等技术,实现了微博综合排序算法。在新浪微博平台上,有效的实现了对帖子数据的算法验证原型系统。在该原型系统中,主要是通过利用微博相关开放技术接口,搭建了微博网站,主要是包括了对整体框架进行搭建,同时有效的实现了新浪微博登陆以及内容发布、检索、博文收藏等基本功能,同时有效的实现了对好友的添加功能。通过对图形数据库进行使用,有效的实现了对用户关系网数据的存储。通过算法实验及算法效率测试,本文提出的综合排序算法有着较好的算法性能,同时能够解决传统仅依靠时间排序的局限和不足。