云南药材三七的数据预处理以及多分类器识别的研究

来源 :云南民族大学 | 被引量 : 0次 | 上传用户:okey100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中草药产业是中国的一大特色产业,拥有着悠久的历史。同一品种的中草药因其生长的地理环境、气候等各方面因素影响,在药用价值上有着一定的区别。在中草药销售市场上,由于产地的原因,来自不同产地的同种药材的价格也有高有低,这让一些不法商贩因利益驱使在售卖高品质产区的药材时掺入了低品质的药材,导致很多人花了大价钱却没有买到真正道地产区的药材。比如三七这种药材,由于文山特殊的环境,文山当地产的三七的药用价值就比云南其他产地的三七来的高,但市场上很多商贩用外观和文山三七一样的其他产地的三七出售给买家,而仅仅通过肉眼是很难对三七的产地进行区分,这样会扰乱药材市场的秩序,对买家也造成了经济损失。这使得正确区分出道地药材成为了中草药市场的迫切需求。  本文的主要研究内容是:研究不同产地的三七不同提取部位数据集的数据预处理方法,如属性选择,实例选择等,在这些预处理方法中寻找出对本文数据最优的方法;对不同产地三七不同提取部位数据集的分类进行研究,寻找用于三七不同提取部位数据分类的最优的分类算法,并对得出的分类算法进行更深入的探索,探索该算法的重要参数对算法分类性能的影响;探索将半监督学习方案应用于本文数据集之后的分类效果。  本文的主要工作包括:  1.实现对来自不同产地的三七不同部位的指纹图谱数据集即主根数据集和剪口数据集进行数据预处理,包括属性选择、实例选择等操作,并探索最优的预处理参数设置,使其能够在分类阶段达到良好的分类效果。  2.将预处理好的数据分别运用几种经典的单分类器算法以及多分类器算法进行分类,并比较分类效果,对实验结果进行讨论以寻找最合适的分类算法。并对实验得出的合适的分类算法进行进一步的研究,探索算法中重要参数的修改对算法分类性能的影响。  3.探索半监督学习对本文数据集的分类效果,对比不同划分标签比例对该学习方案分类性能的影响。
其他文献
在今天的互联网时代,人们生活、社交、工作的每一个环节都将生成海量多媒体信息。图像是信息传播中的不可缺少构成,视频信息的基石。图像不可替代,已然成为人们生活不可或却
随着数字音乐技术的迅猛发展和手机等移动设备存储容量的增加,如何快速、有效地检索音乐信息成为迫切需要解决的问题。传统基于文本的检索方法,只能对有标注的数据信息进行检索
随着网络技术的发展,多网络的融合被看作是未来网络的发展方向,网络融合即基于统一综合的网络进行各种信息的通信,使得用户可以通过不同的终端在任何时候,任何地点都可以享受无缝
铁路运输在国民经济发展中起到了举足轻重的作用。为了加快铁路信息现代化建设步伐,铁道部在全路投入“列车车号自动识别系统”的工程建设。其目标是在所有机车,车辆上安装射
随着以WCDMA,CDMA2000和TD-SCDMA为代表的3G移动通信全面进入商用部署的完成,多媒体服务与应用将会得到广泛推广,而3G在速率、服务质量、无缝传输等方面的局限性也将日益显露出
认知无线电(Cognitive Radio,CR)技术是促进无线通信发展的关键技术。它旨在充分利用空闲的频谱以提高频谱的利用率。然而,只有准确的检测出主用户(授权用户)信号是否存在才能使
智能家居网络系统以现代计算机技术、通信技术、控制技术为基础,采用先进的管理软件,对整个家居的信息通信、安全防范、报警集中于一个平台上进行管理。 论文以实际的科研项
JPEG2000是最新一代的静态图像编码算法,由ISO标准化组织正式命名为ISO15444。JPEG2000与传统的JPEG最大的不同,在于它放弃了JPEG所采用的以DCT变换为主的区块编码,而是采用