基于复杂网络社团划分的文本聚类方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:googoosin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类是文本挖掘的一种重要方法,提出了一种加权复杂网络社团划分的新算法,通过不断寻找复杂网络中的稠密集并对其进行适当操作,达到了划分加权复杂网络的目的。将该算法应用于文本聚类,将文本用向量空间模型表示,用余弦公式计算文本之间的相似度,根据邻居节点构造出加权复杂网络,用提出的算法对加权复杂网络进行社团划分。对Reu-ters-21578数据集中的部分样本进行聚类,实验结果表明了该方法具有良好的聚类效果。
其他文献
皖电东送淮南至上海特主压交流输电示范工程长江大跨越工程采用耐-直-直耐方式跨越长江,根据工程特点,安徽送变电工程公司结合施工需要及现有设备和工器具提出了特高压长江大
加强煤矿专业人力资本投资是我国煤炭工业可持续发展的重要保障。财税政策作为政府宏观经济调控最重要的手段之一,对促进煤矿专业人力资本投资有着重要的作用。本文在对煤炭企
在EKP提供商与客户的双方知识交互过程中,知识转移是链接ERP服务双方的桥梁,知识转移的深度和效果直接决定了企业日后应用ERP系统的效果。本文在研究ERP系统实施过程中知识转移
为了提高现有空中交通管制(ATC)地理信息系统(GIS)数据查询的速度,提出了一种基于STR packed R树索引的空管GIS数据查询方案。该方案主要是利用建立STR packed R树索引来执行数据查询,取代现有系统遍历整个模型的方法。为进一步提高R树索引的查询性能,采用图元细分和分层索引两种方式降低R树结点间的交叠面积,并且分析并选择了合适的R树结点分支因子。在空管GIS上的实验结果表明,该
【摘 要】 安然事件等一系列财务舞弊案的爆发将人们的关注焦点从外部的环境转移到企业内部的控制机制上来。内部审计在企业经营和管理中发挥着重要作用,它既是企业内部控制机制的重要组成部分,又是监督与评价内部控制的主要手段。内部审计的重要性和必要性日益突出。本文对内部审计的三大发展趋势进行了解读,包括重新介入内部控制、推动更有效的公司治理以及对内部审计师的期望在改变,并在这三大发展趋势中解析了内部审计的增
计算机病毒变形技术的出现产生了大量的变形病毒,传统的病毒检测系统在变形病毒检测方面不尽人意。针对该现象,提出了一种消除病毒变形的零转换技术,其中包括消除病毒变形技术常
教育成本问题研究,对高等教育的发展有着重要的作用,高等教育成本分担与补偿已经引起了社会各界的广泛关注,成为一个值得探讨的问题。文章就我国高等教育成本分担与补偿这一问题
为了进一步降低计算复杂度,提高视频图像的质量,通过对帧间预测模式的运动补偿分析及图像的频谱分析,提出了一种基于帧间预测模式的插值滤波器算法。该算法对每个不同的分块
针对火灾时避难人员流动的基本特性及建筑物的设计布局对人群拥挤状况的影响,引入烟雾对逃生人员产生作用力的公式,并加入到社会力中,在保留计算疏散时间的基础上,提出了方向指示
【摘 要】 结合学习曲线及三阶段学习曲线基本原理,本文拟对1999年-2006年沪深两市A股179家ST公司年报数据进行判别分析,以求出上市公司财务风险初始学习阶段、稳定学习阶段和缓慢学习阶段的分界点,从而针对各分界点,提出上市公司财务风险防范与规避的相关措施,以利于上市公司结合自身情况合理避险。  【关键词】 学习曲线; 财务风险; 上市公司; 判别分析    ST公司是遭受特别处理(Speci