基于Nutch的分布式文件系统研究

来源 :煤炭技术 | 被引量 : 0次 | 上传用户:sdbradycn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
成功的搜索引擎都有稳定的分布式文件系统,采用分布式计算的方式,使得网页数据、索引文件都分散存储在网络中,检索从分散的数据中通过分布式计算获取.通过分析分布式搜索引擎,研究了Google的分布式文件系统CoogleFS以及MapReduce算法,针对Nutch的特性.提出了FoundClear算法和一种NDFS的解决方案,最后与GoogleFS系统作了比较.
其他文献
期刊
目的观察门冬胰岛素30联合口服降糖药治疗新发2型糖尿病疗效。方法选取餐后2h血糖≥13.9 mmol/L的2型糖尿病患者64例,随机分为2组,治疗组32例,早餐前一次皮下注射门冬胰岛素3
采用Visual C++ 2005作为软件开发平台,利用美国环境系统研究所(ESRI)的GIS组件mapobjects 2.3,实现了柱状图、饼状图、点值图几种类型的专题图绘制功能,可视表达了矿井通风信息某一方面的规律。这为分析通风现状,发现安全隐患,进行科学决策提供了1种科学、便捷的手段。
期刊
期刊
儿童支气管哮喘是小儿发育时期最常见的慢性反复发作的呼吸道疾病,常见而难治,如诊治不及时,随病程的延长可发生气道不可逆性狭窄和气道重塑,严重影响生活质量。作者在应用西
期刊
随着国内石化企业的发展,进口的设备日益增多,但是对于职工的培训迫在眉睫。本系统设计了一套仿真培训系统,在本套系统中利用了现有物力资源,减少开发的投入成本,加快开发速
今年是毛泽东同志《在延安文艺座谈会上的讲话》发表七十周年,《讲话》把马克思主义基本原理同中国革命文艺实践创造性地结合起来,是中国共产党领导文艺事业的经典文献。中国
针对污水处理曝气过程控制的间歇性、非线性、大滞后、直接控制变量难以在线测量等控制难点,本文介绍了控制溶解氧浓度DO参数的办法,来间接反映化学需氧量COD这一重要的水质指标。本文选用简单易行的查控制表方法,在PLC上实现模糊控制策略,并通过MATLAB仿真,比较了PID、模糊控制两种控制策略的运用,结果表明模糊控制策略控制效果较好。