基于BIRCH算法和深度神经网络在学科分析中的应用研究

来源 :重庆交通大学 | 被引量 : 0次 | 上传用户:feng_lingpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学科热点的研究分析,能够有效的指导学科管理工作,把握学科发展的方向。但随着信息化时代的到来,文本数据在急剧的增长,学科在任务、结构等方面也发生着变化。面对信息化的挑战,传统的学科热点分析方法很难快速、准确的处理大规模文本数据,分析学科发展的方向。因此,在面对大规模文本数据时,如何解决传统学科热点分析方法存在的问题,准确的探索学科发展方向,具有重要的研究意义。
  本文以某校信息学科发展的现状及大数据技术为依托背景,在研究国内外相关文献的基础上,通过对BIRCH聚类算法中CF节点之间距离的计算方法及DNN神经网络结构进行改进,从宏观、微观两个层面对信息学科的发展进行分析研究,主要从以下几个方面展开研究。
  第一,在学科发展的宏观分析中,通过分析BIRCH聚类算法聚类过程、理论基础及应用领域,针对BIRCH算法在进行文本特征计算时,欧氏距离计算方法易忽略文本数据间语义关系等问题,通过添加余弦距离对CF节点之间距离的计算方法进行了重新定义。同时,对BIRCH算法的聚类流程做进一步改进,提出了EC-BIRCH算法。通过与其他聚类算法进行实验对比,结果表明EC-BIRCH算法提高了文本分类的准确率。
  第二,在学科发展的微观分析中,通过添加注意力层对DNN深度神经网络结构进行改进,改进后的DNN神经网络强调了特征词的比重,进一步对文本贡献率大的特征词进行提取。通过多个文本数据的实验结果证明,结合注意力层的深度神经网络,简称为DNN-AF模型,能够有效的对文本数据进行深度挖掘。
  第三,将改进后的两种算法应用到某校信息学科发展分析中,以学科发展资料为数据基础,通过EC-BIRCH聚类算法对某校信息学科发展的主要研究领域进行宏观分析。在宏观分析的基础上,采用DNN-AF网络模型深度挖掘学科未来发展的方向。通过与SPSS软件多维尺度分析方法进行对比,本文提出的EC-BIRCH算法和DNN-AF网络模型比SPSS软件多维尺度分析方法在处理大规模文本数据的准确率、有效性等方面上更有优势。
其他文献
本文进行的是以液体CO2(LCD)为冷媒的保鲜冷藏汽车保温特性的实验研究及其运行经济性分析。第一章就冷藏汽车的研究、应用现状进行了简述;接着在第二章中就LCD在毛细管中的流动特性进行了分析;第三、四章阐述了实验及其结果;第五章分析了LCD保鲜冷藏汽车的运行经济性。主要研究了环境温度、LCD充装量及厢体结构对冷藏厢保温特性的影响;并对LCD在毛细管中的流动特性及其受到的影响因素进行了实验研究。通过实
学位
该文结合上海锅炉厂有限公司所承接贵州纳雍电厂2台300MW机组燃烧无烟煤锅炉的具体工程项目开展研究.根据纳雍电厂无烟煤锅炉炉膛及燃烧器设计图纸和相关资料,以实炉设计方案为对象,进行流动、燃烧、传热、NO生成全三维数值模拟工作.主要工作由以下两部分组成:用于纳雍电厂燃无烟煤锅炉CE-WR型浓淡偏差煤粉燃烧器性能研究;纳雍300MW无烟煤锅炉炉内过程及NO生成数值模拟.对纳雍电厂燃无烟煤锅炉CE-WR
学位
永磁同步电机具有低功耗、高功率密度、高转矩电流比、结构紧凑等优异性能,但因其转子含特有的永磁材料,相较于其它电机在运行中不可避免有发生失磁故障的风险。因此,本文在永磁体发生不同程度均匀失磁故障情况时,对永磁同步电机系统内部参数进行识别与分析其变化规律,并深入研究对电机外在性能产生的影响。为电机系统失磁故障诊断技术和在线监测提供理论支持,对保障永磁同步电机长期稳定、安全、可靠运行具有重要意义。  首
学位
学位
学位
近年来,随着工业自动化的发展,传统现场总线由于其带宽及吞吐量等限制,已经无法满足现代工业的要求。实时以太网以其成熟的特性已成为自动化领域中不可或缺的技术。EtherCAT(Ethernet control automation technology)作为实时工业以太网的代表,以其速率快、实时性好、拓扑灵活等特点在工业自动化领域得到广泛应用。然而目前国内EtherCAT主从站的实现还需要依赖国外专用
随着工业系统的规模日趋增大,系统元件的多元化,复合故障出现的概率大大增加。复合故障由于其故障模式的多样性,故障形式的复杂性,为其诊断带来了困难与挑战。然而,针对单一故障的故障诊断方法难以精确的识别出复合故障的所有故障模式。因此,本研究在国家自然科学基金“基于流形学习的风电系统传动部件多故障诊断及退化状态识别”,重庆市研究生科创项目“考虑多征兆特征分析的复合故障诊断方法研究”等基金的支撑下,针对复合
学位
股票市场在当今经济生活中受到越来越多关注,其走势受到经济、政治、文化等多种因素影响,运行规律复杂,准确把握市场规律有助于交易者获利。相对于常规价格预测,投资者更喜欢找到股价反转模式,因此对K线反转模式挖掘分析就显得尤为重要。  本文以股票历史数据为研究对象,首先针对线性分段函数无法有效划分K线序列,提出了K线区域划分算法;又发现K线模式挖掘算法计算繁杂,因此构建了基于模糊K线反转模式挖掘模型;继而
学位
随着信息技术的快速发展,以大数据和人工智能技术为牵引的智慧交通建设成为推进我国“交通强国”的重要趋势。当前桥梁工程领域已开展了较好的信息化建设,构建了多个桥梁检测、健康监测等信息化管理系统,但尚未实现由“信息化”到“知识化”的升级,面向该领域的管养决策支持不足,其智能化程度亟待进一步提升。桥梁检测领域文本是桥梁管理养护业务体系中重要的数据资源,包含大量的桥梁基本属性、结构参数和检测病害等信息。充分
学位