Hadoop技术内幕深入解析MapReduce架构设计与实现原理
突然之间,大数据一下子就“火”了,开源软件Hadoop也因此水涨船高。得益于一些国际领先厂商,尤其是FaceBook、Yahoo!以及阿里巴巴等互联网巨头的现身说法,Hadoop被看成大数据分析的“神器”。IDC在对中国未来几年的预测中就专门提到了大数据,其认为未来几年,会有越来越多的企业级用户试水大数据平台和应用,而这之中,Hadoop将成为最耀眼的“明星”。
尽管Hadoop整个生态系统是开源的,但是,由于它包含的软件种类过多,且版本升级过快,大部分公司,尤其是一些中小型公司,难以在有限的时间内快速掌握Hadoop蕴含的价值。此外,Hadoop自身版本的多样化也给很多研发人员带来了很大的学习负担。尽管当前市面上已有很多参考书籍,比如《Hadoop:The Definitive Guide》、《Hadoop in Action》、《Hadoop Operations》等,但是,至今还没有一本书能够深入地剖析《Pro Hadoop》、Hadoop内部的实现细节,比如JobTracker实现、作业调度器实现等。也正因如此,很多Hadoop初学者和研发人员只能参考网络上一些零星的源代码分析的文章,自己一点一点地阅读源代码,缓慢地学习Hadoop。而本书正是为了解决以上各种问题而编写的,它是国内第本深入剖析Hadoop内部实现细节的书籍。
本书以Hadoop 1.0为基础,深入剖析了Hadoop MapReduce中各个组件的实现细节,包括RPC框架、JobTracker实现、TaskTracker实现、Iask实现和作业调度器实现等。书中不仅详细介绍了MapReduce各个组件的内部实现原理,而且结合源代码进行了深入的剖析,使读者可以快速全面地掌握Hadoop MapReduce设计原理和实现细节。
-
HTML粘性滑块导航页面Demo - 可自由填充内容
HTML 代码<!doctype html> <html> <head> <meta charset="UTF-8" /> <meta name="viewport" content="width=device-width, user... 782 0 25-04-07 -
PS工笔画-溶图背景素材
938 0 25-04-11 -
php提高性能的几个小技巧
尽可能少使用魔法函数。 尽量少用错误抑制符@。 少使用正则表达式。 合理运用内存。 避免在循环表达式中进行计算。 如:for($i=0;$i<count($arr);$i++),可以写为:$max = count($arr); for($i=0; $i<$max; $i++) 避免在循环体里面操作数据库、调接口等耗时操作。减少网络请求次数、减少IO调用 451 0 21-04-13 -
语音日记本带php后端
一个简易的语音日记本小程序(服务器语言选的PHP)。以语音的方式记录生活点滴。替代文字日记的理由是我觉得语音可以记录更多的信息,而不... 1070 0 24-09-16 -
CSS3开关按钮Radio样式
366 0 21-05-17 -
采购管理单据 - 企业管理表格
共同材料供应计划.doc原料耗用分析表.doc提货单.doc收料单.doc收货单.doc材料仓库日报表.doc物料欠发单.doc直接原料明细表.doc裁工领料记录... 1018 0 24-07-31 -
资源圆体
1409 0 24-07-24 -
实用人体解剖图谱 头颈分册
《实用人体解剖图谱》结合临床的实际需要,按照人体的部位进行分册,即头颈分册、躯干内脏分册和四肢分册。为了让读者对人体的结构建立一个... 1267 0 24-06-18
发表我的评论
- 这篇文章还没有收到评论,赶紧来抢沙发吧~