【摘 要】
:
从大规模数据中"摘要"出最能满足效用函数收益的有限个数据对象,可以被归纳为次模函数最大化问题.并行过滤算法在满足流数据访问次数限制与实时响应的条件下,通过分布式筛选的
【基金项目】
:
国家自然科学基金项目(61572266,61472194)~~
论文部分内容阅读
从大规模数据中"摘要"出最能满足效用函数收益的有限个数据对象,可以被归纳为次模函数最大化问题.并行过滤算法在满足流数据访问次数限制与实时响应的条件下,通过分布式筛选的方式实现次规模最大化,但在提升摘要速率时效用函数收益损失较大.提出一种流数据分层次模最大化算法HSSM,在仅访问一次数据集的条件下,采用流水并行的分布式处理框架得到接近于标准贪心算法的次模函数收益,同时改进HSSM通过累积摘要的压缩存储、分层过滤低增益对象提升摘要速率.该方法在数据摘要问题的相关领域具有广泛的应用性,如文档集中代表性文章的选取
其他文献
目的:研究诱导型一氧化氮合酶(iNOS)和血管内皮生长因子(VEGF)在肺癌组织中的表达及其与间质血管生成的关系.方法:应用原位分子杂交和免疫组织化学方法检测41例肺癌组织中iNO
目的:研究锌对小鼠各脏器金属硫蛋白(MT)基因表达的影响.方法:将小鼠随机分为注锌组和对照组,注锌后不同时间或不同剂量锌注射后16 h断头处死动物,取一定量肝、脑、胸腺及脾
目的:探讨刺五加叶皂甙(Acanthophopanax senticosus,ASS)诱导肺癌细胞凋亡的作用机制,寻找治疗肺癌的新途径.方法:经流式细胞仪和透射电镜观察ASS对Spc-A1肺癌细胞的细胞周
中国古人对宇宙形成的思考或始于传说中的伏羲时代,《周易》《老子》出现了宇宙形成叙事结构,神圣化了的农耕技能促成宇宙由混沌到秩序的升华,创世经历了秩序空间、秩序时间
目的:探讨自拟舒肝解郁灵对抑郁模型小鼠行为及血清中白细胞介素2(IL-2)、白细胞介素6(IL-6)和皮质醇的影响.方法:选择Open-field法评分相近的成年小鼠,应用分养和长期不可预
目的:研究生脉注射液在体外循环术中作为心脏冷停搏灌注液的添加剂使用,对抗体外循环术中心肌缺血性损害及预防再灌注损伤的作用.方法:心脏手术患者60例,随机分为实验组(30例
目的:观察慢性病毒性肝炎患者应用大剂量干扰素治疗前后白细胞介素-10(IL-10)、白细胞介素-12(IL-12)水平变化及意义.方法:应用ELISA法测定应用大剂量干扰素治疗前后的乙肝病