基于逻辑回归的金融数据分类系统的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:davidfeng2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近半个世纪,伴随着人类进入大数据时代,计算机多媒体技术得到快速而惊人的飞速发展。与之相伴的是,各种图像和文本数据库中存储的有价值信息日新月异,金融类的新闻、公告和资讯等数据对于关心市场变化和热衷于投资的人们来说有着极其重要的参考价值。然而金融数据的来源广泛、种类繁杂,对于人们想直接找到最关注的信息带来了很大的困扰。因此如何对海量的金融数据进行有效而精确快速的管理与检索成为新时期的重大挑战,金融数据的分类问题成为迎接这个挑战的所需要处理的核心问题。金融数据分类平台可以实现对互联网中存在的金融数据做到实时收集并快速的分到准确的类别,可以高效的处理海量的文本信息,有极高的实用价值。分类系统是金融数据分类平台中的一个核心部件,它能够通过对样本数据处理和训练得到性能优越的分类器,并将分类器作用于实时数据的处理,能够很好的实现金融数据分类平台的分类功能,有很好的应用价值。根据以上介绍的背景,本文所要解决的问题是对海量的金融类文本数据实现快速高效的自动分类。通过对金融数据类别的市场需求调研,确定了常用的18个类别为最终的分类结果。本文的主要工作是完成对金融数据分类系统的设计与实现,结合金融数据中专有名词较多、特征较为明显的特点,本文采用逻辑回归算法实现对分类器的构造,将样本数据经过预处理后得到训练样本和测试样本,对训练样本进行特征提取、特征加权、特征向量化,传入逻辑回归模型训练得到分类器,用测试样本测试分类器的分类效果并根据评价结果进一步优化分类器,最终把分类器应用到对实际的金融数据分类。金融数据分类系统可应用在相关的门户网站和数据分类平台,实现对金融类的新闻、公告、资讯等文本数据的自动分类,也可以应用于公司或个人对大量金融类文本的信息管理,帮助用户快速定位到最想要获取的相关内容,有非常好的应用价值。金融数据分类系统实现对数据的分类可以作为金融类信息检索和数据挖掘的基础,进一步提高信息的利用率。本文提出的金融数据分类系统经过测试,有很好的分类效果,有非常好的应用前景。
其他文献
从品种特性、果实生长发育特点、果实细胞组织结构等内部因素和气象因子、土壤条件、栽培措施等外部因素方面综述了油桃裂果的影响因素,寻找引起油桃裂果的主要原因,并提出防
基于STM32微控制器设计了一种嵌入式远程监控系统服务器,可运用于数据中心远程监控系统中。嵌入式Web服务器是远程监控系统的核心组成部分,实现传感器数据采集,并向远程监控中心
本文针对于现阶段的中国古典山水画的绘画技法在实际的教学应用中所存在的问题的探究,指出了创新性教学应用对于中国古典山水绘画技法的重要性和必要性,同时提出了一些自己关
风景园林是城市园林的重要组成部分,为了使风景园林更加适合城市的发展和市民的需要,要对风景园林的设计进行系统性的分析和思考.本文在描述当前风景园林设计中存在问题的基
本文采用边界单元法,进行任意二维稳定声场的数值计算。通过两个算例的数值解与精确解的比较,说明边界单元法是求解工程声学问题的一种有效方法。编制的程序可用于任意二维稳
通过采集该振动信号并分析频谱图及检修过程分析,确认造成振动值偏高的主要原因。
20世纪70年代世界范围爆发的能源危机导致全球能源消耗费用呈高态势增长,促使西方发达国家探索通过节约能源来提升能源使用效率的节能方式。美国率先提出合同能源管理机制,这
近日,牡丹江市国土资源局在开展“端正政风行风,优化发展环境”活动中做出郑重承诺:严格依法行政,坚持执政为民。
精准扶贫是针对不同的贫困区域环境、不同贫困农户状况,运用合规有效程序对扶贫对象实施精准识别、精准帮扶、精准管理的治理贫困模式。在精准扶贫的视角下,发展产业是治理贫