书籍名称:Hadoop大数据原理与应用实验教程
页数:334
作者:徐鲁辉
出版时间:2020
ISBN:9787560655437
出版社:西安:西安电子科技大学出版社
简介:本书作为《Hadoop大数据原理与应用》(本书作者编写,西安电子科技大学出版社出版)的配套实验教程,系统介绍了Hadoop生态系统中各个开源组件的相关知识和实践技能。全书分为“基础实验篇”和“拓展实验篇”两篇,共10章,涉及数据采集、数据存储与管理、数据处理与分析等大数据应用生命周期中各阶段典型组件的部署、使用和基础编程方法。“基础实验篇”内容包括部署全分布模式Hadoop集群、实战HDFS、MapReduce编程、部署ZooKeeper集群和实战ZooKeeper、部署全分布模式HBase集群和实战HBase、部署本地模式Hive和实战Hive;“拓展实验篇”内容包括部署Spark集群和Spark编程、实战Sqoop、实战Flume、实战Kafka。本书内容翔实,案例丰富,操作过程详尽,并配有完整的立体化资源,既可作为高等院校研究生、本科生的大数据技术原理与应用课程的实验指导书,也可作为教师参考书,同时也可供相关技术人员参考。(相关资源可在西安电子科技大学出版社网站下载。)
前部分目录
上篇 基础实验篇——2
实验1 部署全分布模式Hadoop集群——2
1.1实验目的、实验环境和实验内容——3
1.2实验原理——3
1.2.1 Linux基本命令——3
1.2.2 vim编辑器——6
1.2.3 Java基本命令——7
1.2.4 SSH安全通信协议——8
1.2.5 Hadoop——8
1.3实验步骤——12
1.3.1规划部署——12
1.3.2准备机器——14
1.3.3准备软件环境——14
1.3.4获取和安装Hadoop——22
1.3.5配置全分布模式Hadoop集群——22
1.3.6关闭防火墙——30
······
······
······