论文部分内容阅读
即时通信是当前最流行的网络在线沟通工具之一。随着网络技术的迅猛发展,承载用户在线状态以及多种即时数据交换消息的即时通信协议朝着多样化、个性化的方向发展。目前,在对众多网络应用的研究中,私有的即时通信由于缺乏公开文档参考,在数据识别和信息提取方面都存在很大挑战。另外,即时通信中蕴含的用户通联网络,也是社会网络分析领域备受关注的重要课题。针对上述问题,本课题以主流即时通信协议为基础,面向网络中即时通信数据的识别和应用,开展以下几方面的工作:1、针对私有的即时通信协议,本文研究主流即时通信协议数据。分析归纳即时通信类应用协议在主体功能和交互过程、数据信息、消息格式等方面的主要特点,并将应用协议的消息格式分为基于二进制结构化和文本的两种类型,并深入分析其格式特点,为进一步研究做好准备。2、针对即时通信数据的识别和信息提取等问题,本文研究了基于应用载荷的协议特征发现方法。根据即时通信消息的格式特点,分别设计出基于频繁模式和最长公共子序列发现的特征发现算法,得到协议消息中的胎记特征和指纹特征。实验表明,针对不同即时通信协议数据,本方法的协议特征发现结果,不但识别率高、兼容性好,并且能够根据需求提取出较细致的消息类型特征,为进一步筛选和提取有价值的数据信息打下基础。3、针对即时通信中的通联关系网络,本文研究构建和分析通联关系的有效方法。本文分析即时通信消息中通联标识信息的位置特征和形态特征,选择通联特征识别和提取方法,依据动态传递的即时消息,综合用户标识和关联标识等信息,基于局部会话还原的方法构建通联关系。利用社会网络分析的相关理论描述和刻画即时通信的通联关系网络,并在网络中对用户的通联关系及相关属性进行分析。4、针对即时通信通联网络中影响用户关系的复杂因素,本文研究综合评价通联紧密度的方法。根据即时通信不同于其他通信方式的特点,全面分析了紧密型通联关系的三方面特征,并在深入分析基础上实现具体指标的量化。重点研究了利用社会临场感理论在即时通信中的应用,并根据单一指标和基于TOPSIS理论的多个指标对用户的通联关系进行分组实验和综合评价。实验表明,综合评估方法优于任何基于单指标评估用户通联关系的方法,对即时通信中的社会网络分析相关工作具有重要意义。