作者:刘 铭
书号:ISBN 978-7-5636-6915-8
出版时间:2021年11月
开本:小16开
页数:236
字数:319千字
定价:38.00元
全书共8章,内容由浅入深,可读性强。在简单阐述原理的基础上,重点阐述应用的详细实现过程。第1章绪论,阐述大数据技术现状,介绍Hadoop技术生态圈构成。第2章Linux基础,介绍Linux系统的安装、配置、命令使用、集群规划和实践。第3章Hadoop基础,对Hadoop技术展开详细介绍。第4章高可用Hadoop集群,系统描述基于Zookeeper构建高可用Hadoop集群的配置过程和生产实践应用。第5章Hive基础,介绍数据仓库Hive的应用场景和实战操作。第6章Hbase基础,介绍Hbase数据库的应用场景和实战操作。第7章Spark基础,对Spark进行详细介绍,并配合具体算法的应用进行实战操作。第8章数据采集基础,对数据采集方法、流程和工具进行系统阐述。
本书是北京市教育委员会2019年度批准立项项目“警务大数据应用技术研究”(项目编号KM201914019002)成果之一,可以作为高等院校大数据技术相关专业本科生的教材,也可作为大学生大数据应用技能竞赛的辅导用书,亦可供从事大数据相关研究的技术人员参考。
本书最大的特色就是实践性较强,在阐述大数据技术相关基础知识的同时辅以大量实践实例,培养学习者的学习兴趣,提高学生的动手能力。
第1章 绪论
1.1 大数据概述
1.2 对大数据的理解
1.3 大数据处理的基本流程
1.4 Hadoop概述
1.5 Spark概述
第2章 Linux基础
2.1 Linux简介
2.2 Linux系统安装
2.3 Linux命令
第3章 Hadoop基础
3.1 HDFS简介
3.2 Hadoop集群安装
3.3 HDFS的文件存储机制
3.4 HDFS的数据存储管理
3.5 HDFS的数据读写过程
3.6 HDFS常用命令
第4章 高可用Hadoop集群
4.1 Zookeeper基础
4.2 高可用Hadoop集群配置
第五章 Hive基础
5.1 Hive概述
5.2 元数据库基础
5.3 Hive的配置
5.4 Hive使用方式
5.5 Hive的DDL
5.6 数据导入与导出
5.7 Hive的查询
第6章 HBase基础
6.1 HBase概述
6.2 HBase接口
6.3 HBase数据模型
6.4 HBase实现原理
6.5 HBase运行机制
6.6 HBase应用
6.7 HBase实战
第7章 Spark基础
7.1 Spark概述
7.2 Spark集群的安装
7.3 SparkShell
7.4 Spark RDD基础
7.5 Spark案例实战与详解
第8章 数据采集基础
8.1 数据采集概述
8.2 Flume基础
8.3 Sqoop基础
参考文献
山东省青岛市黄岛区长江中路66号中国石油大学出版社 266580
(0532)86981236
版权所有(C)2022 中国石油大学出版社 鲁ICP备15009631号-6 (署)网出证(鲁)字第017号