数据挖掘技术在警务综合信息系统的应用研究

被引量 : 11次 | 上传用户:zel0088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着警务信息化不断推进,大量警务信息系统的应用,在其中积累了大量的案件和嫌疑人等公安数据。海量的公安数据存储在不同的数据源中,且存在非常大的数据质量问题,可能是不同的格式,难以综合分析;由于不同业务系统采集和管理的侧重点不同,一类数据源中所体现的信息是不完整的,在独立数据源中进行分析时由于数据的不完整或者缺失带来判断失误、线索中断等;大量的分析依靠人工的、重复性的工作,导致分析人员将大量的精力集中的情报线索的获取、整理、清洗、比对等重复性劳动中,而不能将主要精力集中在业务层面的分析上;高价值的情报往往极少,而且其价值越高,通常时效性越强,而当前的分析手段导致了获取情报需要较长的时间,在领导层和决策层进行分析的时候,需要进行大量的手工报表统计,不但工作量大而且分析过程较慢,不能准确及时的指导工作。数据挖掘技术是从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术,在科学研究、银行、电信、保险、交通、零售等很多领域都得到了广泛的应用。然而,由于公安数据的敏感性和机密性,数据挖掘技术在警务综合信息系统上的研究与应用上却滞后于其他领域。因此,大量的公安数据无法得到有效的应用,不能转化为知识为公安决策提供支持。本文以警务综合信息系统为研究背景,分析了公安数据的数据源与数据结构,使用CDC、Kettle数据抽取工具,对各种数据进行数据抽取、清理、集成、转换、归约,建立公安数据仓库;在数据挖掘分析过程中引入数据立方技术,分析数据立方的几种建模模式,并通过对公安数据立方体进行局部物化处理,提高挖掘分析的处理速度;运用关联规则挖掘、决策树分析、相关案件挖掘等数据挖掘算法,结合公安数据进行应用研究。对公安数据中的出入境数据挖掘频繁项集,根据目标属性产生关联规则;对出入境数据生成决策树,然后通过剪枝等方法简化决策树,生成决策规则;对公安数据中的案件数据进行转换和聚合,通过相似度矩阵方法挖掘相关案件;最后,在警务信息系统中研究对公安数据的决策分析与多维分析的设计与实现。
其他文献
维托尔德·卢托斯拉夫斯基(Witold Lutoslawski,1913—1994)是二十世纪现代乐坛中极具影响力的波兰作曲家,因其独特的结构思维和个性鲜明的音乐语言而在六十年代的诸多音乐流
离子反应是中学化学反应的主要类型,能揭示反应的本质,是高考必考内容,要快速准确写出离子方程式,必须掌握好物质分类知识和强弱电解质知识,熟练运用的技能及技巧,只要离子与
在建筑工程中,电气线管预埋伴随着土建施工而进行,有些PVC管需暗敷在钢筋混凝土楼板内,但在楼板支模、扎筋、浇筑混凝土、拆模等施工或主体砌砖及搬运时,往往造成伸出楼面的
为培育高产玉米品种,提高玉米种植效益,邯郸市农业科学院通过多年优良自交系筛选和杂交组合测配,以自交系H33为母本、LH196为父本杂交选育出玉米新品种邯玉396。该品种在2017
作为“第三利润源泉”的物流业已成为国民经济的基础产业,并受到世界各国的广泛关注。物流园区作为一种创新的物流节点,在物流业的发展中极为重要。它通过产业的集聚和资源配
研究采用合作学习策略中的“小组成绩分组法”,为期10周,研究对象为48名一年级非英语专业本科生。研究工具为成绩测验、态度量表、合作学习行为评估表以及访谈。学习过程为研究
新课程改革背景下,构建高效课堂,提高课堂教学效率成为当下教学的迫切任务。农村小学的师资力量、现代化教学资源较为薄弱,构建高效课堂尤为必要。本文从挖掘贴近学生生活实际的
经济社会可持续发展需要水资源可持续利用的支撑。进入21世纪以来,阜平县水资源量减少的态势明显,降水量下降了11.1%,而地表水资源量、入境水量、总资源量下降幅度均高达60%以上。
职业倦怠是个体在生理和心理上耗尽枯竭的一种状态,它是个体无法正确应付职业压力而产生的负面结果。教师一直是职业倦怠的高发人群,而高中教师由于肩负着帮助学生应付高考的
改革开放以来,中国的面貌发生了翻天覆地的变化。对于我国的发展战略究竟是选择发挥比较优势战略还是提倡自主创新战略,学界一直在争论。从学界的争论和有关实证研究可以看出