面向多源、多视角的在线流特征选择关键问题研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:zhangsanzong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在线流特征选择(Online Feature Selection with Streaming Features,OSFSF)作为数据降维的有效方法,以实时过滤不相关和冗余特征的特点,引起广泛关注。然而,以往研究通常只考虑单个数据源,无法处理同一组实例的特征有多个来源的实际应用问题。根据特征选择过程是关注类标签与数据源的相关性还是数据源之间的相关性将其分为多源特征选择和多视角特征选择。因此,如何针对分类任务展开多源特征选择并验证方法的有效性,如何针对聚类任务展开多视角特征选择并验证方法的有效性是需要亟待解决的关键问题。本文的主要内容如下。首先,提出面向多源流特征的在线特征选择算法MSFS并通过实验评估算法性能。算法在分析多源数据的实例分布和不同数据源特征之间交互作用的基础上,通过相关性分析、源内冗余分析和源间冗余分析三个阶段在线处理流特征。算法试图挖掘不同数据源之间的潜在关系,在特征流入时动态调整目标变量的马尔可夫毯(MB),获得最优特征子集。将MSFS算法与Alpha-investing、OSFS和SAOLA在多个数据集上进行对比实验,并将选择的特征分别应用于四种不同的分类器,从分类精度、选择特征数量和运行时间多个角度进行对比,验证MSFS算法的有效性。其次,提出面向多视角流特征的在线无监督特征选择算法MVSFS并通过实验评估算法性能。算法通过局部结构保留和公共子空间集成两个阶段学习多视角数据的内在结构,充分考虑不同视角间的共性和互补性,联合特征选择和子空间学习,通过在特征选择矩阵上施加L2,1范数约束来过滤不相关和冗余特征,获得最优特征子集。将MVSFS算法与ACSL和CGMV-UFS在多个数据集上进行对比实验,并将选择的特征分别应用于K-Means和谱聚类,使用标准化互信息、准确率等七种指标进行算法评估,验证MVSFS算法的有效性。最后,将MSFS算法和MVSFS算法分别应用于车道占用率分类和新闻主题聚类场景下,并进行对比实验,验证算法在实际场景中的良好适用性。
其他文献
电动汽车发展日趋成熟,充电资源却未满足其日益增长的需求。基于区块链众包的实时导航在电动汽车充电时发挥重要的作用。如何在获取众包进行路径规划过程中激励矿工计算众包任务,直接影响路径规划的质量。因此,本文针对区块链的挖矿诚信问题,基于声誉和概率统计学提出一种激励方法,提高矿工的声誉,激励其保持诚信;针对路况信息众包的矿工选择问题,基于空间众包和逆向拍卖提出一种矿工激励策略,提高矿工选择的效率和路况众包
中医理论知识体系结构庞大,实体和实体间关系错综复杂,需采用合适的技术手段对该领域知识加以组织和存储,以便能灵活地运用到日常生活之中。相较于关系型数据库,知识图谱则更加适合中医理论知识的组织与存储。而准确高效的实体关系抽取则是构建高质量知识图谱的重要基础。本文以自建Co NER&RE-TCM语料库为基础,以形成高性能的多头选择联合抽取模型为目标,围绕多头选择模型中字向量语义表征能力弱、类别不均衡数据
采用正则变换方法将热真空态下介观电容耦合电路的哈密顿转换为谐振子的哈密顿,并利用幺正变换方法将电路量子化,最后应用热场动力学理论(TFD),讨论了介观电容耦合电路在热真空态下的量子涨落,并与绝对零度下的量子涨落相比较。结果表明,有限温度下,电荷和电流的量子涨落随温度而变化,温度越高,量子噪声越大。
通过X射线光电子能谱对沉积在Si基底上的High-K薄膜的热稳定性进行了研究。我们主要研究了铪为主要成分的高介电常数物质。我们分别准备了Al2O3-HfO2层状、HfAlO及HfO2薄膜样品。Al2O3-HfO2及HfAlO样品又进行了快速热处理(RTA)。对RTA前后的XPS能谱比较,结果表明RTA处理对Al2O3-HfO2样品的影响较大。 为了考察high-K物质与Si基底的界面反应,以
购物中心是一种线下的商业模式,主要由管理机构、商户和客户组成。客户是现场消费的顾客,购物中心为其提供一站式服务。商户是在固定区域实体经营的企业,购物中心帮助其扩展客户流量。由于商户布局的固化和其合理性的难以预估,购物中心存在客流分布不均匀问题。客户在完成一次消费后,进而转向就近商户。这导致客流量较多的商户其周围的商户受益较大,距离较远的商户受益较小。如果购物中心直接改变商户布局进行调整客流,会造成
通过构造正则变换,将有源RLC介观电感耦合电路的哈密顿转变为简谐振子的哈密顿。在量子化的过程中,确立了两种形式的幺正算符,并且找到了使计算简化的最佳形式,实现了对介观电路哈密顿的量子化。最后,得出了有源RLC介观电感耦合电路的量子涨落。
"为什么我的眼里常含泪水?因为我对这土地爱得深沉。"这句饱含深情的诗句让我们认识了诗人艾青,同时,我们也被诗人对祖国的挚爱深情所感动。艾青作为中国新诗运动和新诗创作的杰出代表,他的诗歌意象鲜明,个性张扬,富有战斗精神,蕴含时代特征,表现出了积极追求进步和光明的精神面貌,寄寓着对祖国和人民的爱与希望。下面,让我们一起阅读艾青的诗歌,品奇特意象,悟真挚情感。
期刊
计算机动画一直是计算机图形学、虚拟现实和计算机视觉等研究领域的研究重点之一,并在游戏娱乐、影视动画和辅助设计等领域有着重要的应用价值。布料动画是各种动画场景中不可或缺的一部分,其仿真效果会直接影响到画面的真实性。布料的碰撞和摩擦接触行为是影响布料仿真真实感的重要内容,如何在仿真过程中处理布料交互时复杂的碰撞成为当前研究的主要瓶颈之一,选择快速准确的碰撞检测和处理能有效避免布料穿透等视觉伪影的出现。
单幅图像去雨作为计算机视觉领域中的图像清晰化研究的重要组成部分和内容,其主要应用于无人汽车自动驾驶和道路视频监控乃至军事侦察等领域。因此解决单幅图像去雨问题从而获取有价值的背景信息,成为去雨任务中的重要工作。在综合分析国内外研究现状的基础之上,针对国内外现有单幅图像去雨问题研究成果的不足,通过深入挖掘单幅图像中的深度雨滴特征,充分利用深度学习等相关理论知识,针对单幅图像,如何利用创新性算法去雨并得
推荐系统作为现如今信息化时代的产物,帮助人们在没有确切需求或者数据量庞大时解决信息超载问题,为用户提供便携访问的高质量推荐。但是,由于推荐系统自身的脆弱性以及网络信息数据的繁杂性,推荐系统很容易遭到攻击,尤其是群组攻击对推荐系统造成很大的影响。这是因为攻击群组可以在比较短的时间内高效地改变推荐系统为用户提供的个性化推荐列表,进而影响整个推荐系统的可信度。因此,如何有效的检测出协同过滤推荐系统中的群