温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
Fayson的github:https://github.com/fayson/cdhproject
提示:代码块部分可以左右滑动查看噢
1.文档编写目的
HDFS是组成Hadoop平台的关键服务,部署的正确与否直接影响到你整个集群的健康状态,以及所有应用能否正常的运行或者高效的运行,包括SQL,MapReduce,Spark等。前面Fayson也介绍过《CDH网络要求(Lenovo参考架构)》,《CDH安装前置准备》,《如何为Hadoop集群选择正确的硬件》和《如何给Hadoop集群划分角色》,都是和如何正确部署集群相关的。这里再把HDFS服务单独拎出来,专门说明一下,希望大家在部署一个Hadoop集群时就进行科学的规划设计,从而避免上线了,已经存储了大量数据了还要调优HDFS。如果你不是采用正确的姿势来部署HDFS的话,常见你可能会碰到以下问题:
1.NameNode经常故障或者切换
2.写入性能低下
3.Checkpoints需要很久才完成
4.High disk queue length (await)
5.与Zookeeper失去连接
为了集群的正常运作,打好良好的基础是非常重要的。对一个集群在各方面进行适当的配置可以避免性能或任何不可预见的问题。