基于集成学习的拉曼光谱血液种属鉴别方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:dxy_10121012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
拉曼光谱分析技术以其无损、灵敏度高的优势,近年来被广泛应用在药物鉴别、食品安全检测、石油化工分析等领域。在血液种属鉴别方面,机器学习方法结合拉曼光谱技术的检测比传统分析方法更为便捷、准确。另外,由于拉曼光谱数据往往维度高且存在较多的冗余信息或噪声干扰等因素,对模型质量造成影响。文中借鉴集成学习方法抗噪声能力较强、稳定性较高的特性,提高血液种属鉴别模型的预测准确度,并利用特征波长选择改善模型运行效率,具体研究内容如下:(1)将随机森林算法与Ada Boost相结合提出了RF_Ada Boost血液种属鉴别方法。采用随机森林算法作为Ada Boost框架的弱分类器,在模型迭代过程中不断自适应调整样本分布和权重,最终训练成为性能优良的强分类器。文中以血液拉曼光谱数据为实例,以RF、SVM、ELM、KELM、BP以及SAE作为对比方法,并在不同规模训练集下进行人类和非人类血液种属鉴别实验,实验结果表明,RF_Ada Boost方法能够表现出较高的分类准确度和较强的稳定性。(2)将思维进化算法优化的BP神经网络与Bagging相结合提出了MEABP_Bagging血液种属鉴别方法。使用思维进化算法参数寻优的结果初始化BP神经网络,缩短网络训练时间并避免其陷入局部最优值影响模型质量,进而利用Bagging框架构建集成模型,改善其稳定性并减小泛化误差。将MEABP、BP、SAE、SVM、ELM以及KELM作为对比方法分别进行血液种属二分类及多分类鉴别实验,结果表明,MEABP_Bagging方法得到的鉴别准确度和稳定性在所有实验模型中均能达到最优。(3)将最小角回归与连续投影算法相结合提出了LAR-SPA拉曼光谱特征波长选择方法。采用最小角回归算法和连续投影算法分两阶段对拉曼光谱数据进行特征波长选择,以达到降低光谱数据维度并减少数据冗余的目的。将全波长、CARS、UVE、LAR以及SPA作为对比方法分别在药品和血液拉曼光谱数据集上对模型性能进行验证,结果表明,LAR-SPA模型能够有效实现特征波长选择并提高建模质量。
其他文献
电流分流监测器芯片在当今复杂的集成电路系统中起着重要的作用,通过监测电子设备中的电流大小可以判断电路是否正常工作,从而能实时监测电路的工作状态,以避免出现瞬间电流过大而烧毁电子设备的情况。因此,设计一款具有高性能的电流分流监测器来精确地检测流向负载端的电流是十分必要的。本论文设计的是一款结构新颖的双向电流分流监测器,该电路能在输入共模电压-4~4V的范围内实现精确的双向电流检测,且在保证精度的前提
结肠癌是一种常见的消化道恶性肿瘤,大多数结肠癌由腺瘤性息肉演变而来,因此早期筛查结肠息肉具有重要的临床意义,通过结肠镜检测息肉是最有效的方法,在检测过程中可能会漏检某些息肉,利用计算机辅助诊断技术,对结肠息肉图像分割就显得很重要。近几年,随着医疗辅助诊断技术的逐步发展,产生了多种结肠镜下息肉图像分割方法,其中包括传统的结肠息肉图像分割方法和基于深度学习的结肠息肉图像分割方法,传统的结肠息肉图像分割
天波超视距通信是工作在短波频段内一种重要的通信方式,在军事和民生用途中都发挥着不可替代的作用。通信系统中收发天线质量影响着整个系统的工作质量,因此收发天线的设计至关重要。短波通信系统要求天线不仅在工作频段上实现宽频带特性,而且需在满足俯仰面和方位面波束指向的情况下,实现全频段高增益。短波天线物理尺寸大,占地规模巨大,需配套相应支撑结构和地网建设,建造成本十分昂贵。如何合理设计短波天线,使其在保证电
随着我国经济社会的不断发展,为了与全国和各个行政区的经济情况相适应,社会保险(医疗/生育保险,养老保险,失业保险,工伤保险)和公积金领域的法律、法规和政策也在不断地调整。这种调整的必然结果就是:各个时间片段和行政区域上会产生大量的领域法律、法规、政策和司法解释等文本。可以发现,这些文本中对某一相同的领域术语的定义、解释和内涵不尽相同。这就产生了领域术语语义漂移现象。研究如何自动化获取这种漂移是有意
在当今社会快速发展信息高速传播的背景下,新的媒介技术的出现与发展改变了传统媒体格局下的信息传播格局,信息不再被“推给”受众,相反的是人们利用互联网将所需要的信息“拉出来”,并参与到创造信息的活动中,渗透到人们生活的方方面面。地位的相等,角色的转换,再加上网络的开放性、匿名性与交互性等特性,人们在网络上畅所欲言,发表着自身的看法与观点等等,也因此留下了用户海量的评论数据。庞大的数据信息看似毫无用处,
路由协议是无线传感器网络(Wireless Sensor Network,WSN)的关键通信协议,对WSN的性能有着重要影响。与传统的确定性路由相比,机会路由充分考虑了无线信道的广播特性、时变性和干扰不规则性,有效的提高了无线多跳网络的吞吐量和传输可靠性,已成为无线传感器网络路由协议研究的热点之一。然而,现有的机会路由协议大多在节点持续工作的状态下运行,能量消耗很大。低占空比技术将节点置于周期性的
弱胶结软岩遇水膨胀、泥化,造成巷道围岩变形大、支护结构破坏,严重影响安全。以围岩松散破碎、易泥化水解、底臌变形严重的王洼二矿21采区下部车场为研究对象,通过相关资料查阅、现场调研、理论分析、实验室试验、数值模拟以及现场观测等研究手段,系统地分析了 21采区下部车场弱胶结软岩岩巷的变形破坏特征、破坏原因并提出了切实有效的支护技术。通过围岩岩样XRD、XRF以及电镜扫描得到巷道围岩的成分组成以及微观结
随着经济和技术的快速发展,各个产业在地理上的集聚现象也越来越显著,尤其是高新技术产业集群,一方面它能够促进地区经济增长,发挥地区优势,另一方面技术的快速发展也使得高新技术产业集群进一步促进我国对外贸易结构的转型和升级。而与此同时,出口复杂度作为一种能够解释并预测经济增长的驱动力,它的提升在我国经济处于新常态的背景下实现经济动力从要素驱动、投资驱动到创新驱动的转换以及提升发展中国家出口竞争力具有重大
随着生产全球化和制造企业的规模化,分布式生产调度在各个大型制造企业中广泛应用,成为车间调度研究领域的重点研究问题。分布式车间调度问题的目标是在各约束条件下,对工件
在科技发展的今天,人们的日常的生产生活中每天会发送和收获大量的图像,而大多数图像中会包含大量的文本信息。人们在生动图像的信息中会快速收获大量的内容,其中对人们影响最大的就是场景图像中带来的信息,但是场景图像就必然会出现图像质量不高的情况,如何能准确快速的识别文本中的信息成为一个急需解决的问题。自然场景图像文本识别技术在对图像文本识别时首先要多文本进行分类和检测,通过对文本定位提取文本特征序列进而再