基于密度流的聚类算法

来源 :第29届中国数据库学术会议 | 被引量 : 0次 | 上传用户:xsb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  基于密度的聚类算法是到目前已提出的多种聚类算法中的一种非常有效的方法,这类算法可以检测数据空间中任意形状的簇,然而目前已有的一些基于密度的算法,如DBSCAN,DENCLUE,因为算法的全局参数问题而不适合处理不同密度的簇;SNN算法则由于需要从k最近邻相似矩阵中重构出共享最近邻图而在效率上有所欠缺.为了更有效率地检测数据集中的簇,提出了一种基于密度流模型的算法DEFAT.算法假设数据集中的每个对象都有一定的密度流,对象间通过传送密度流以共享密度信息,从而达到分离密集区域和稀疏区域的目的,DEFAT能够很好地检测不同形状、不同密度、不同大小以及有重叠的簇.在人工数据集和真实数据集上的实验表明,DEFAT无论在效果上还是在效率上,都优于现有经典的基于密度的算法.
其他文献
  各种GPS定位设备的普及使得记录人们的移动轨迹成为可能。这些轨迹蕴含了用户的兴趣和爱好,不同的轨迹则反映了不同的用户个性。提出一种基于用户轨迹聚类分析的推荐算法,
海上微综合能源系统是海洋油气工程的基础.为合理评估其运行风险,保证海洋资源安全开发,提出基于物质-能量流解析的海上微综合能源系统风险评估方案.通过对关键设备采用包含
为了给学校卫生工作提供依据,我们于1995年3月对两所点校二年级和五年级的393名学生进行了测试,并对有关因素进行了调查。1对象和方法1.1对象:某市两所小学二年级和五年级学生,共3
  目前针对社会网络的隐私保护虽然进行了广泛的研究,但是仍然存在缺陷和不足.K-自同构隐私保护模型通过构建K-自同构图来防止结点识别攻击,但是在为结点提供隐私保护的同时
会议
  通过机器学习等方法发现数据库系统用户的合法行为模式,并据此对用户提交的数据库请求实时进行检测是一种主动的深度防御机制。依据结构化查询语言(SQL)的语法结构和语义
会议
针对当前风电调频备用容量长期闲置、未充分服务于电网运行的问题,深化研究大规模风电调频备用容量优化配置方法,对于电网调频能力、风力发电经济性、电网调峰方面均具有重要
  提出了一个有效的基因差异共表达模式挖掘算法:DiPattern,从两个真实的基因表达数据中挖掘出具有差异共表达特征的行常量基因。该算法使用样本范围支持度来衡量具有关联性
会议
为了在多微网交易中充分发挥分散调度的优势、保护各子微网的隐私,以及进行高效快速的计算,文中提出了一种并网型多微网系统多时间尺度交易机制和基于深度学习的交易策略优化
  社会网络传播最大化问题是指在一定规模的网络数据中,限定传播源头进行网络传播,使得最终传播的群体数量范围达到最大,该问题已被证明为NP难的。以hill-climbing为代表的贪
近日,地产大亨杨国强再次成为媒体焦点:欲以100亿港元从邵逸夫手里收购TVB。这个20年前的包工头有意投身传媒领域,而且出手就不同凡响,他的胜算到底有多大? Recently, real