基于复杂网络的数据模式发现与对象评估方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:zhanggang406
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,海量数据中蕴藏着潜在的、具有重大价值的信息与指示,亟待研究开发有效的数据分析方法对其进行高效利用。数据的存储方式多种多样,其中关系型数据是最为普遍的存储方式之一。本文即以关系型数据为研究对象,运用复杂网络的理论与方法对关系型数据进行分析,并重点针对数据网络化,数据关键特征发现以及数据对象评估开展研究,具体如下:第一,针对关系型数据的网络化问题,提出了一种基于数据特征的网络构建方法,可有效发现数据关键特征。在该特征网络中,数据特征被抽象为节点,数据对象在两数据特征下的类别概率被抽象为节点之间的连接,该特征网络可有效指导发现海量数据对象中蕴藏的不同数据模式。进一步,通过节点重要性排序,再对重要节点进行Logistic回归,可找到数据中的关键特征。基于医疗数据的分类实验结果表明:由于网络结构相对于数据特征取值更鲁棒,数据特征网络方法能够发现影响数据分类的关键特征,数据分类效果更好。第二,针对数据对象评估问题,提出了基于网络适应度模型的数据对象评估方法。如何对数据对象进行客观有效评估,始终是值得持续深入研究的问题。本方法借鉴复杂网络中适应度模型来建模数据对象的演化过程,并基于实际观察引入网络节点的删减机制,建立了通过网络适应度对数据对象进行评估的方法。基于研究生学位数据的实验结果表明:文科与理工科导师的适应度分布表现出显著不同的模式,并且此种模式还揭示了若干有趣的人力资源现象,有望为数据对象评估提供一种新的参考。
其他文献
咪唑发色基团为核心的取代衍生物具有独特的质子授-受性能和光学性能,在发光材料领域一直受到青睐。但是,2,4,5-三取代咪唑衍生物,特别是大共轭体系的咪唑衍生物不溶于水,限制了在水介质中直接研究其光学性能及应用。近几年,我们课题组对具有较大共轭体系的2-对位取代苯基-4,5-(4-取代苯乙烯基)咪唑衍生物的合成和光学性能做了大量的研究工作,除了1-[4-(4,5-二取代基-1H-2-咪唑基)]苯甲醛
目的:通过观察加减无比薯蓣丸治疗气阴两虚型非增殖期糖尿病视网膜病变(non-proliferative diabetic retinopathy,NPDR)患者的临床疗效,为临床用药提供参考。材料与方法:收集
第一部分、被动型Heymann肾炎大鼠足细胞损伤程度与NEAT1表达水平关系目的:通过制备被动型Heymann肾炎大鼠模型探索大鼠足细胞损伤程度与NEAT1表达水平关系。方法:雄性SD大鼠
近年来,石油天然气能源的意义和地位日益提升,与之相关的科学研究如火如荼。地震波场模拟作为地震勘探研究的一环,其重要性日益凸显,尤其在逆时偏移和全波形反演等方面,对地震波场数值模拟的精度有了更高的要求,模拟精度直接关系到这些反演处理方法的成像效果。基于有限差分的地震波场数值模拟是常用的波场模拟方法,被广泛应用于各类地下介质的研究。本文介绍了有限差分法的原理、实现方法和误差分析。同时,针对波场模拟无边
目的:ER低表达(ER阳性1%~9%)对内分泌治疗应答目前尚不清楚,在临床上是否应用内分泌治疗也存争议。本研究比较ER阴性、ER阳性1%~9%及ER阳性≥10%乳腺癌患者临床病理特征及预后,
当前,我国社会朝多元化的趋势高速发展,由政府包揽一切公共事务的管理方式越来越难以适应形势的发展。政府由对公共事务的管理转变为治理,公共领域事务由政府单一主体参与转
随着化石能源危机日益严重,热电材料越来越受到人们的广泛关注。Mg2X(X=Si,Ge,Sn)及其固溶体属于一种环境友好的中温(400800 K)热电材料,具有原料丰富、价格便宜、环境污染小和密度低等优点。虽然n型Mg2X热电材料的ZT值已经达到1.3左右,但是p型Mg2X热电材料的ZT值仍然不足1。因此,提高p型Mg2X材料热电性能成为Mg2X体系的研究重点之一。首先,采用两步固相法、球磨和热压合
炔类化合物在有机化学,药物化学以及生物化学领域非常常见,是很多药物与重要天然产物的重要结构单元。末端炔烃类化合物作为有机化合物的基础组成部分,可以进行广泛的衍生和拓展。而炔丙基类化合物是许多天然产物,合成药物以及精细化学品的常见基元,也是有机合成与药物合成中具有重要意义的合成中间体。铜钛共催化的5H-噁唑啉酮的炔丙基化反应可以用以合成具有手性中心的三级醇类化合物并保留末端炔烃,可用于进一步的修饰与
研究背景和目的人类免疫缺陷病毒(Human immunodeficiency virus,HIV)是一种单链RNA病毒,能够引起人类获得性免疫缺陷综合征(Acquired immunodeficiency syndrome,AIDS),导致机体免疫功能的逐渐缺失而缺乏对外界病原体的抵抗,最终导致多种机会性病原体的共感染从而产生多重临床症状直至死亡。HIV基因进化速率较高,很容易产生新的流行株和耐药
富林洼陷是渤海湾盆地济阳坳陷沾化凹陷的一个次级构造单元,本论文在前人基础上,以沉积地质学、测井地质学、岩相古地理学、地球物理学理论为指导,利用测井、录井、地震反演资料对该研究区的沉积充填和砂体展布特征进行研究。取得了如下成果认识:1.在对富林洼陷区域地质背景研究基础上,通过井震标定,建立钻井与地层剖面相结合的区域地层格架。在单井地层划分、井震标定、连井地层对比基础上,编制了各组断裂体系展布图、各组