论文部分内容阅读
为了稳步推进我国电子政务建设的发展,国家有关当局开始重视企业基础信息库等基础性、战略性政务信息库的建设。2002年8月5日,中共中央办公厅下发了[2002]17号文件,启动了人口基础信息库、法人单位基础信息库、自然资源和空间地理基础信息库、宏观经济数据库的建设。2003年7月16日,国家税务总局、国家工商总局联合下发了国税发[2003]81号文件,进一步明确了税务部门与工商部门的信息交换内容、信息交换制度与机制。2005年,国家有关当局联合发出了《关于开展企业基础信息共享工作的通知》。2007年修订了《法人单位基础信息库项目建议书》。2007年11月,国家有关部门正式批复了国家公益性专项研究《法人单位基础信息库标准体系研究》课题。近年来,随着相关基础设施建设的不断完善,我国不少省市基本完成了企业基础信息共享平台和交换系统的建设,尤其是杭州和北京等第一批试点城市,标志着我国电子政务建设又进入了新的发展阶段。各试点省市通过工商、税务企业登记信息的实时交换,发现了大量在工商机关登记但未作税务登记或已注销工商登记仍然营业的行为,堵塞了监管漏洞,促进了财税增收;同时,较好地解决了有关部门交叉稽核问题,提高了监管工作效率和公共服务水平,取得了良好的经济效益和社会效益。目前,对企业基础信息资源的应用主要集中于工商、国税、地税和质监局内部,且限于一些基本信息的查找与核对,随着信息化建设的不断发展,这样的应用远不能发挥企业基础信息资源应有的价值,企业基础信息资源最重要的应用是为政府部门提供决策上的支持以及跨部门的协同应用。我国有不少学者致力于研究商务智能技术在政府信息资源管理中的应用,且取得了一定的研究成果,数据仓库技术在政府信息资源管理中的应用相对来说较成熟一点,而数据挖掘技术在政务地理空间信息资源中的应用较其他基础信息资源更成熟。本文主要采用商务智能中的数据挖掘技术对企业基础信息库中的数据进行挖掘,通过比较分析选择了聚类分析作为本文的挖掘方法。本文根据对问题的分析,构建了一个挖掘数据集,选择企业性质、所在地区、企业成立年份、是否外资、是否注销、有无变更记录和行业分类7个细分变量作为对企业进行细分的依据。由于企业基础信息数据量大,且具有一定的聚类特征,本文设计出了一个基于K-means算法的企业基础信息聚类挖掘模型,K-means算法对处理挖掘集较大的数据集,是相对可伸缩和高效的。并应用该模型对大连市企业基础信息库中的数据进行了挖掘,由于企业基础信息中的很多属性都是分类离散的,原来的距离计算公式在这里不太适合,选择了基于概率改进的距离公式,对于改进的K-means算法应用两种软件进行了比较分析,通过分析挖掘结果,发现改进了的K-means算法更适合于本文的实例分析。本文针对SSAS组件中聚类分析模型的运行结果分析了大连市企业发展的基本特征、发展规律以及企业发展存在的一些问题,尤其是私营企业的发展。近年来,外资企业进入大连与私营企业竞争零售业和制造业,私营企业的市场占有率越来越低。并根据呈现出来的特征和存在的问题,针对私营企业和外资企业的发展提出了一系列对策,以推动大连市企业向快速、稳定、均衡的方向发展。