CMDC:一种差异互补的迭代式多维度文本聚类算法

来源 :通信学报 | 被引量 : 3次 | 上传用户:chj0821031
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统多维度文本聚类算法把文本表示与聚类过程分离,忽略了维度间的互补特性的问题,提出了一种差异互补的迭代式多维度文本聚类算法——CMDC,实现文本聚类与特征调整过程的统一优化。CMDC算法挑选维度聚类间结果的互补文本,基于局部度量学习算法利用互补文本促进聚类的特征调优,以维度的度量一致性来解决多维度文本聚类的划分一致性。实验结果表明,CMDC算法有效地提升了多维度聚类性能。
其他文献
目的:探讨氯沙坦钾联合苯磺酸左旋氨氯地平对高血压神经内分泌激素的影响。方法:收集180例高血压神经内分泌激素水平异常患者,随机分为观察组和对照组各90例,患者均给予氯沙
为提高无线携能通信(SWIPT)系统的频谱效率和性能,引入非正交多址接入(NOMA)技术构建SWIPT-NOMA机会中继系统模型。针对固定信号功率分配会导致其与系统其他参数无法相互调节,继而影响系统中断概率和资源利用率等问题,提出了一种联合信号功率和时间分配方案,以提高系统中断性能。所提方案在满足信道状态较差节点速率的条件下,推导出信号功率分配的表达式,并得出系统中断概率的数学表达式,最后通过选取
考虑到用户与基站间的相关性和网络的不规则性,建立了基于Matern簇过程(MCP)的非正交多址接入型异构网(NOMA-Het Net)模型,并结合该模型分析了各类用户的覆盖概率。在分析过程中,首先,从理论上推导出用户的信干噪比(SINR);其次,针对现实中的非完美串行干扰消除(SIC)方案,给出了一种更符合实际情况的SINR上限更新规则;然后,利用空间坐标系、概率论、随机几何理论和顺序统计量等数学
针对边缘算力受限,难以部署复杂结构的人脸检测深度神经网络的问题,为减少资源消耗,并保证人脸在多尺度变化、遮挡、模糊、光照等复杂场景下的检测精度,提出了多尺度感知的轻量化人脸检测算法。采用改进的人脸残差神经网络作为特征提取网络,并提出双分支浅层特征提取模块,并行分支理解图像多尺度信息,进而由深浅特征融合模块将底层图像信息与高层语义特征融合,配合多尺度感知的训练策略监督多分支学习差异化特征。实验结果表
为解决复杂的频谱分配问题,引入具有较强并行计算能力的双目标鲸鱼优化算法(WOA),提出一种可以有效反映实际频谱需求的Stackelberg博弈,设计一种双目标WOA优化的分布式天线系统(DAS)频谱共享调度算法。仿真结果表明,从最优价格、用户收益等多个指标进行性能对比,所提算法具有较好的频谱共享分配效果,能实现公平有效的频谱分配,为未来通信网络频谱共享模式提供了重要参考。
研究了分组马尔可夫叠加传输的神经网络(NN)译码方案。利用NN,实现了不同网络结构、数据表征形式的基本码译码器。在此基础上,将所实现的基本码译码器嵌入迭代译码机制中,提出了基于NN的分组马尔可夫叠加传输的滑窗译码算法,并分析了其对应的性能下界。所提出的译码算法提供了一种将NN运用到长码译码的解决思路,即用NN替代译码中的部分模块。仿真结果表明,利用NN实现的基本码译码器可以达到最大似然译码性能。基
听力教学是英语教学中的一个难点,也是一个重点。本文讨论了听力教学的三个环节,分析了教师在听力的三个环节中的角色和主导作用。
目的探讨芝麻素(Ses)对大鼠化学性心肌损伤的保护作用及可能机制。方法SD大鼠30只,随机分为正常组、模型组和Ses组,每组10只。模型组和Ses组SD大鼠给予D-半乳糖[180mg·(
仔猪的消化系统和免疫系统发育不完善,对疾病比较敏感。而断乳应激,又加剧了仔猪的这种敏感性,导致其发病率高,严重影响了养殖效益。本文从营养的角度综述了维生素、微量元素
针对目前网络风险评估模型中忽略攻击代价和入侵意图对网络安全产生影响的问题,为了准确评估目标网络风险,提出一种基于贝叶斯攻击图的网络入侵意图分析方法。利用由漏洞价值、攻击成本和攻击收益计算出的原子攻击概率,结合贝叶斯信念网络量化攻击图,建立静态风险评估模型,并利用入侵意图动态更新模型,实现对网络风险的动态评估,为攻击面动态防御措施提供了依据。实验表明,所提模型不但可以有效地评估网络整体的安全性,而且